ChatGPT üreticisi OpenAI bir sonraki büyük ürün sürümünü duyurdu: Resmi olarak OpenAI o1 olarak adlandırılan Strawberry kod adlı üretken bir yapay zeka modeli.
OpenAI, daha karmaşık soruları bir insandan daha hızlı yanıtlamak üzere eğitilmiş “akıl yürütme” modellerinden oluşan planlı bir serinin ilki olan o1 adlı yeni bir model yayınlıyor. Daha küçük ve daha ucuz bir versiyon olan o1-mini ile birlikte piyasaya sürülüyor.
o1, OpenAI’ye göre, normalde üretken yapay zeka modellerine çelme takan bazı mantıksal tuzaklardan kaçınıyor. Bunun nedeni, o1’in bir komutun veya sorunun tüm parçalarını dikkate almak için daha fazla zaman harcayarak kendi kendini etkili bir şekilde kontrol edebilmesidir.
OpenAI, Q* olarak bilinen bir şirket içi projeden doğan o1’in özellikle matematik ve programlama ile ilgili zorlukları çözmede usta olduğunu söylüyor. Ancak, yalnızca metinden oluşan o1’i diğer üretken yapay zeka modellerinden niteliksel olarak farklı “hissettiren” şey, sorgulara yanıt vermeden önce “düşünme” yeteneği olduğu belirtiliyor.
“Düşünmesi” için ek süre verildiğinde, o1 bir görevi bütünsel olarak düşünebilir – ileriyi planlayabilir ve yanıtlara ulaşmasına yardımcı olan uzun bir süre boyunca bir dizi eylem gerçekleştirebilir. Bu da o1’i, bir avukatın gelen kutusundaki ayrıcalıklı e-postaları tespit etmek veya bir ürün pazarlama stratejisi üzerinde beyin fırtınası yapmak gibi birden fazla alt görevin sonuçlarının sentezlenmesini gerektiren görevler için çok uygun hale getiriyor.
“OpenAI’de araştırmacı bilim insanı olan Noam Brown, X’teki bir dizi gönderide, “o1, ödüller ve cezalar yoluyla sisteme özel bir düşünce zinciri yoluyla yanıt vermeden önce ‘düşünmeyi’ öğreten” pekiştirmeli öğrenme ile eğitildi” dedi ve OpenAI’nin o1 modelleri için özel olarak uyarlanmış yeni bir optimizasyon algoritması ve eğitim veri seti kullandığını ekledi. “Ne kadar uzun süre düşünürse, muhakeme görevlerinde o kadar iyi performans gösteriyor.”