OpenAI, o3-mini için ayrıntılı düşünce izleme teknolojisiyle DeepSeek rekabetine yanıt veriyor

OpenAI, en son düşünme modeli o3-mini'nin akıl yürütme süreci hakkında daha fazla ayrıntıyı ortaya koyuyor. Bu değişiklik şu tarihte duyuruldu: OpenAI'nin X platformundaki hesabıBu durum, yapay zeka laboratuvarının, düşünme kodunu tam olarak sergileyen rekabetçi bir açık kaynak modeli olan DeepSeek-R1'den gelen artan baskıyla karşı karşıya kalmasıyla birlikte geliyor.

o3 ve R1 gibi modeller, sorunu parçalara ayırmak, farklı yanıtlar düşünmek ve test etmek ve nihai bir çözüme ulaşmak için ek kodlar oluşturduğunuz uzun bir "fikir zinciri" (CoT) sürecinden geçer. Daha önce OpenAI'nin akıl yürütme modelleri düşünce süreçlerini gizliyordu ve yalnızca akıl yürütme adımlarına ilişkin üst düzey bir genel bakış sağlıyordu. Bu durum, kullanıcıların ve geliştiricilerin modelin mantığını anlamalarını ve talimatlarını ve istemlerini doğru yöne yönlendirmek için değiştirmelerini zorlaştırdı.

OpenAI, fikir havuzunu rekabet avantajı olarak değerlendirdi ve rakiplerinin kendi modellerini eğitmek için bunu kopyalamasını önlemek amacıyla gizledi. Ancak R1 ve diğer açık kaynaklı modeller tüm akıl yürütme sürecini ortaya koydukça, şeffaflığın eksikliği OpenAI için bir dezavantaj haline geldi.

Yeni o3-mini, Ideas serisinin daha detaylı bir versiyonunu gösteriyor. Başlangıçtaki sembolleri henüz göremiyor olsak da, bunlar düşünce süreci hakkında daha fazla netlik sağlıyor.

Bu uygulamalar için neden önemlidir?

O1 ve R1 modelleriyle yaptığımız önceki deneylerimizde, O1'in veri analizi ve muhakeme problemlerini çözmede biraz daha iyi olduğunu bulmuştuk. Ancak, modelin neden hata yaptığını bilmenin bir yolu olmaması önemli bir sınırlamaydı ve model, web'den alınan karmaşık gerçek dünya verileriyle karşılaştığında sık sık hata yapıyordu. Öte yandan R1 düşünce süreci, sorunları gidermemizi ve düşüncemizi geliştirmek için istemlerimizi değiştirmemizi sağladı.

Örneğin, yaptığımız deneylerden birinde her iki model de doğru cevabı veremedi. Ancak R1'in detaylı içgörüleri sayesinde sorunun modelin kendisinde değil, web'den bilgi toplayan alma aşamasında olduğunu keşfedebildik. Diğer deneylerde, R1'in düşünce tarzı, ona verdiğimiz bilgileri analiz edemediğinde bize ipuçları sağlayabildi, ancak O1 bize yanıtını nasıl formüle edebileceğine dair çok kaba bir genel bakış sağladı.

Yeni o3-mini modelini, daha önce o1 ile yaptığımız deneyin bir varyasyonunda test ettik. Modele Ocak 2024'ten Ocak 2025'e kadar çeşitli hisse senedi fiyatlarını içeren bir metin dosyası sağladık. Dosya karmaşıktı ve biçimlendirilmemişti, düz metin ve HTML öğelerinin bir karışımıydı. Daha sonra modelden, Ocak 140'ten Ocak 7'e kadar her ayın ilk gününde Muhteşem 2024 hissesine eşit olarak dağıtılmış 2025 dolarlık yatırım yapılan bir portföyün değerini hesaplamasını istedik (daha zorlayıcı hale getirmek için istemde "Muhteşem 7" terimini kullandık).

Bu sefer o3-mini fikir serisi gerçekten çok yardımcı oldu. Öncelikle model Mag 7'nin ne olduğunu düşündü, verileri yalnızca ilgili hisse senetlerini tutacak şekilde filtreledi (sorunu zorlaştırmak için verilere Mag 7 olmayan bazı hisse senetleri ekledik), her bir hisse senedine yatırılacak aylık tutarı hesapladı ve doğru yanıtı sağlamak için son hesaplamaları yaptı (portföyün, modele beslediğimiz verilerde son kaydedilen zamanda değeri yaklaşık 2200 $ olacaktı).

OpenAI hâlâ birçok ayrıntıyı gizli tuttuğu için yeni algoritmanın sınırlarını belirlemek için daha fazla test yapılması gerekecek. Ancak ilk testlerimizde yeni formatın daha kullanışlı göründüğünü gördük.

Bu OpenAI için ne anlama geliyor?

DeepSeek-R1 yayınlandığında, OpenAI'nin akıl yürütme modellerine göre üç belirgin avantajı vardı: açık kaynaklıydı, düşük maliyetliydi ve şeffaftı.

O zamandan bu yana OpenAI bu açığı kapatmayı başardı. O1'in madenciliği yapılan her bir milyon token için maliyeti 60 dolar iken, o3-mini'nin maliyeti yalnızca 4.40 dolar olup, birçok kıyaslamada o1'i geride bırakıyor. ABD'li sağlayıcılar tarafından ihraç edilen her bir milyon token için R1'in maliyeti yaklaşık 7 ila 8 dolar. (DeepSeek, kendi sunucularında çıkarılan her bir milyon token için R1 modelini 2.19 dolardan sunuyor, ancak Çin'de barındırıldığı için birçok kuruluş bunu kullanamayacak.)

CoT çıktılarındaki yeni değişiklikle OpenAI şeffaflık sorununu bir nebze olsun aşabilmiştir.

OpenAI'nin modellerini açık kaynaklı hale getirmek konusunda ne yapacağı ise henüz belli değil. R1, piyasaya sürüldüğü günden bu yana birçok farklı laboratuvar ve şirket tarafından uyarlandı, çeşitlendirildi ve barındırıldı; bu da onu potansiyel olarak işletmeler için tercih edilen düşünce modeli haline getirdi. OpenAI CEO'su Sam Altman, açık kaynak tartışmasında "tarihin yanlış tarafında" olduğunu itiraf etti. Bu farkındalığın gelecekteki OpenAI sürümlerinde nasıl tezahür edeceğini göreceğiz.