Yapay zeka modelleri: muazzam yeteneklere sahipler ancak video oyun sektöründe yetersiz kalıyorlar

Yapay zeka araçları gelişmeye devam ettikçe, karmaşık görevleri onlara devretmeye sürekli olarak teşvik ediliyoruz. Büyük dil modelleri,LLM'ler) E-postalarımızı yazmak, sunumlar oluşturmak, uygulamalar tasarlamak, videolar oluşturmak, internette arama yapmak ve bulguları özetlemek ve çok daha fazlası. Ancak hâlâ en çok zorlandığım konu video oyunları.

Bu yıl şu ana kadar yapay zeka alanındaki en büyük iki şirket (Microsoft ve Anthropic), modellerinin oyun yaratmasını veya oynamasını sağlamaya çalıştı ve sonuçlar muhtemelen birçok kişinin beklediğinden çok daha sınırlı oldu. Bu durum, özellikle uzun vadeli stratejik planlama ve karmaşık karar alma gerektiren görevlerde, üretken yapay zekadaki mevcut zorlukları vurgulamaktadır.

Bu, onları üretken yapay zekanın şu ana kadar gerçekte ne yaptığını gösteren mükemmel örnekler haline getiriyor; kısacası: eskisinden çok daha fazlasını yapabilir, ancak her şeyi yapamaz. Bu durum, üretken yapay zekanın hala gelişim aşamasında olduğunu ve artan yeteneklerine rağmen bazı alanlarda hala sınırlamalarla karşı karşıya olduğunu göstermektedir.

Microsoft, yapay zeka ile Quake II üretiyor

Video oyunu üretimi, video yapımında karşılaşılan zorluklara benzer şekilde, hareketin tuhaf ve bozuk olması ve yapay zekanın belirli bir süre sonra "gerçeklikle" bağını kaybetmeye başlamasıyla karşı karşıyadır. Microsoft'un son girişimi, Herkes deneyebilir.Bu, yapay zeka tarafından üretilen bir versiyondur Quake II.

Oyunu birkaç kez oynadım ve gerçekten garip bir deneyimdi. Hiçbir yerden beliren kafa karıştırıcı düşmanlar ve hareket ettikçe etrafınızdaki ortam değişiyordu. Birçok kez yeni bir odaya girdiğimde, kapıya doğru döndüğümde kapı kaybolurdu ve tekrar önüme baktığımda duvarlar hareket etmiş olurdu.

Deneyim, yeni bir oyuna başlamanız için sizi uyarmadan önce yalnızca birkaç dakika sürüyor; ancak şansınız yaver gitmezse, girdilerinize bundan daha önce bile düzgün yanıt vermeyi bırakabilir.

Ama yine de çok güzel bir deneyim ve daha çok insanın bunu görmesinin faydalı olacağını düşünüyorum. Üretken yapay zekanın hangi konularda iyi olduğunu ve mevcut sınırlamalarının neler olduğunu bizzat deneyimlemenize olanak tanır. Etkileşimli bir video oyunu deneyimi yaratabilmemiz etkileyici olsa da, herhangi birinin bu teknoloji demosunu oynayıp bir sonraki Assassin's Creed oyununun yapay zeka tarafından üretileceğine inanması zor.

Ancak bu tür fikirler ve varsayımlar, büyük ölçüde insanların şu anda yapay zeka kavramını duymaktan kaçınamamasından dolayı var. Yapay zekaya hiç aldırmasanız bile, gittiğiniz her yerde size dayatılmaya devam edecektir. Sorun şu ki, ortalama bir insanın edindiği bilgi neredeyse tamamen büyük teknoloji şirketlerinin pazarlama yorumlarından ve haber yayın organları tarafından derlenen yönetici yorumlarından oluşuyor.

Bu, şu tür abartılı ve çelişkili iddiaları duydukları anlamına geliyor:

İklim değişikliği, yoksulluk ve hastalıklar gibi dünyanın en büyük sorunlarından bazılarını çözme potansiyeline sahiptir. (Bill Gates)

Meta'da ve öncelikli olarak bu konuda çalışan diğer şirketlerde 2025 yılında, şirketinizdeki orta düzey mühendisiniz gibi davranabilen ve verimli bir şekilde kod yazabilen bir yapay zekaya sahip olma ihtimalimiz yüksek. (Mark Zuckerberg)

Yapay zekanın etkin kullanımı artık Shopify'daki herkes için temel bir beklenti. Bugün tüm meslekler için bir araçtır ve zaman geçtikçe daha da önemli hale gelecektir. Açıkçası, yapay zekayı işinizde uygulama becerisini öğrenmeden duramayacağınızı düşünüyorum. (Toby Lutke, Shopify CEO'su)

Artık geleneksel olarak anladığımız şekilde yapay genel zekayı (AGI) nasıl inşa edeceğimizi bildiğimizden eminiz. 2025 yılında ilk yapay zeka ajanlarının "iş gücüne katılacağını" ve şirketlerin üretim biçimlerini kökten değiştireceğini düşünüyoruz. (Sam Altman, OpenAI CEO'su)

Yapay zeka, kötü yönetilen uçak tasarımı, yetersiz üretim bakımı veya kalitesiz araba üretiminden daha tehlikelidir; çünkü küçük de olsa medeniyeti yok etme potansiyeline sahiptir. (Elon Musk)

Bütün bunlar biraz fazla geliyor kulağa, değil mi? Bizi aynı anda hem kurtarması hem de yok etmesi, hem profesyoneller için bir araç olması hem de onların yerini alması bekleniyor - ve bu yıl içinde bilimkurgu seviyesinde Yapay Zeka'ya kavuşabiliriz gibi görünüyor. İnsanlar tüm bunları duyduklarında, bu aletlerden harika şeyler beklemeye başlıyor ve tüm ofis çalışanlarının günlerini Star Trek karakterleri gibi bilgisayarlarıyla konuşarak geçirdiğine inanıyorlar.

Ancak gerçek hiç de öyle değil. Gerçeklik Quake II'ye benziyor; titrek ve bulanık, düşman şekilleri anlaşılmaz. ChatGPT düzeyindeki LLM modelleri 2022'de zaten heyecan verici bir atılımdı ve herkesin oynaması için çok eğlenceliydi - ancak büyük teknoloji şirketlerinin şu anda bize dayattığı kullanımların çoğu için yapay zeka yeterli değil. Doğruluk düzeyleri çok düşük, talimatları takip etme yetenekleri çok düşük, bağlam aralıkları çok küçük ve gerçek dünya bilgisinden ziyade yalnızca internet saçmalıklarıyla eğitiliyorlar.

Ancak bir video oyunu yaratmak son derece karmaşık bir hedeftir; sonuçta bunları yapmak tüm insanlardan oluşan ekiplerin yıllarını alır. Bunun yerine video oyunları oynamaya ne dersiniz?

Claude Pokémon Red'i "oynuyor"

İşte bu alanda da deneyler yapanların olduğu ortaya çıktı. Anthropic'in en son modeli, Claude 3.7 Sonesi O oynuyor Pokémon Red Twitch'te Yaklaşık iki aydır piyasada ve Pokémon oynamada büyük dil modeli (LLM) tarafından şimdiye kadar yapılmış en iyi işi yapıyor. Ancak ufak bir çekincesi var; o da onun hâlâ 10 yaşındaki bir insan çocuğunun ortalama seviyesinin çok gerisinde olması.

Sorunlardan biri hızdır; Claude, Viridian Ormanı'nı geçmek gibi şeyler yapmak için günlerce binlerce eylemde bulunur. Bu, yapay zekanın karmaşık görevleri yerine getirirken karşılaştığı zorlukları yansıtıyor.

Neden bu kadar uzun sürüyor? Pokémon savaşlarını stratejik olarak nasıl kazanacağını çözemediğinden değil; aslında iyi olduğu konu bu. Öte yandan çevrede gezinmek ve ağaçlardan, binalardan kaçınmak pek de iyi değil. Claude hiçbir zaman Pokémon oynamak için eğitilmemişti ve onun için piksel sanatını ve onun neyi temsil ettiğini anlamak kolay değildi. Bu zorluklar, veriyi işleme yeteneği ile karmaşık ortamlarla etkileşim kurma yeteneği arasındaki boşluğu vurgulamaktadır.

Özellikle Ay Dağı gibi labirent benzeri yerlerden geçmek onun için oldukça zor oluyor çünkü bölgenin haritasını çıkarmaya ve tekrar takip edilmekten kaçınmaya çalışıyor. Bir keresinde öyle bir köşeye sıkışmıştı ki, oyunun bozulduğu sonucuna vardı ve oyunun yeniden başlatılması için resmi bir talepte bulundu. Bu durum, yapay zekanın gelişmiş yeteneklerine rağmen insanların sahip olduğu sezgisel anlayıştan hâlâ yoksun olduğunu göstermektedir.

Bu ilk denemeler komik anlar da yaşatmadan geçemedi.

Bir gün Claude köşeye sıkışmıştı ve bir şeylerin yanlış olduğuna ikna olmuştu, oyunu sıfırlamak için resmi bir talep yazdı. resim.twitter.com/5RIiCJdxCM— Antropik (@AnthropicAI) Şubat 25, 2025

Ayrıca hedeflerini, daha önce denediği şeyleri veya daha önce ziyaret ettiği yerleri hatırlama konusunda da iyi değildir.

Bunun çok basit bir nedeni var: Büyük dil modelleri (LLM'ler), hafıza işlevi gören sınırlı bir "bağlam penceresine" sahiptir. Yalnızca belirli miktarda bilgi tutabilirler ve Claude bu sınıra ulaştığında, daha fazlasına yer açmak için elindekileri sıkıştırır. Dolayısıyla, "Viridian Şehri'ni ziyaret etti, her binaya girdi ve her NPC ile konuştu" gibi bir bilgi parçası, yalnızca "Viridian Şehri'ni ziyaret etti" olarak sıkıştırılabilir ve bu da Claude'un şehirde yapılacak bir şey olup olmadığını kontrol etmesine neden olur.

Özetle: Claude nereye gittiğini anlayamıyor, duvarlara çarpıyor, rastgele nesneler ve NPC'ler yüzünden kafası karışıyor, nereden geldiğini ve ne yapmaya çalıştığını unutuyor ve verdiği her karar paragraflarca düşünmeyi gerektiriyor. Bu bir eleştiri değil; bunlar büyük dil modellerini (LLM) mümkün olanın sınırlarına kadar zorlayan heyecan verici deneyler.

Ancak yapay zeka etrafındaki tüm bu abartı nedeniyle, insanların bu tür demoları görüp yapay zeka hakkında kendi fikirlerini oluşturması önemlidir. Bazı insanlar, yapay zekanın birkaç yıl içinde en zeki insanları bile geçeceği fikrini satmaya çalışıyorlar. Ama dürüst olduklarını sanmıyorum, onlar sadece satış elemanı. Zirveye henüz yakın değiliz, her şey daha yeni başlıyor.