Yapay Zeka Arama Devleriyle Karşı Karşıya: Claude, ChatGPT, Perplexity ve Gemini – Sonuçlar Şok Edici!

Cevapları arıyorum

Yıllarca yapay zekalı sohbet robotlarını ve özelliklerini test edip karşılaştırdıktan sonra, bu dijital arkadaşların ne hakkında konuştuklarını bildiklerini ve ne zaman sadece aldatıcı davrandıklarını ayırt etmek için bir tür altıncı his geliştirdim. Bu makalede ChatGPT, Gemini, Claude ve Perplexity'nin arama yetenekleri karşılaştırılmaktadır.

Çoğu kişi çevrimiçi olarak yanıt arayabilir, bu kesinlikle yardımcı olur; ancak aramayı yapay zekayla birleştirmenin şaşırtıcı derecede içgörülü yanıtlar (ve bazı daha az içgörülü sapmalar) elde etmesine yol açabilir.

Ekim 2024'te komaya giren ve bugün uyanan bilgili bir arkadaşınız olduğunu hayal edin. Komaya girmeden önce olan her şeyde usta olabilir ama komadan sonra hiçbir şey hakkında hiçbir fikri yok. Yapay zekanın araştırma yapılmadan ortaya çıkışı temel olarak böyledir.

Genellikle tek bir AI sohbet robotuna odaklanıyorum veya aynı anda ikisini karşılaştırıyorum, ancak araştırma bu çabayı artırmaya yetecek kadar önemli görünüyor. Dört önde gelen yapay zeka sohbet robotunu ve araştırma yeteneklerini birbirleriyle karşılaştırmaya karar verdim: OpenAI'dan ChatGPT, Google'dan Gemini, Anthropic'ten Claude ve Perplexity AI.

En açıklayıcı testler, gerçek dünya kullanım senaryolarını simüle edenlerdir. Bu yüzden bazı konular belirledim, aşağıdaki testler için bazı ayrıntıları rastgele seçtim ve sonra bunları araştırma yeteneklerine göre sıralamaya karar verdim.

takvim

Haberler ve güncel olaylarla ilgili bir sınavla başladım. Yakın zamanda iki astronotun dönüşünü düşünerek, dört yapay zeka sohbet robotundan şunları aramalarını istedim: "NASA'nın yaklaşan misyonuyla ilgili son basın bültenindeki önemli noktaların özeti."

Bunu seçmemin nedeni, uzay haberlerinin düzenli olarak güncellenmesi ve belirsiz yanıtların hemen netleşmesi açısından özel bir yere sahip olmasıdır. Tüm chatbot'lar testlerine çoğunlukla korudukları bir üslupla başladılar.

ChatGPT cevabında inanılmaz derecede özlüydü; her cümlede yaklaşan görevlerden çok fazla ayrıntıya girmeden bahsediyordu. Gemini, farklı görevlerin maddeler halinde sıralandığı bir listeyi inceledi, yakın zamanda tamamlanan bazı görevleri ve gelecek planlarıyla ilgili ayrıntıları ekledi. Claude, mevcut ve gelecekteki görevler hakkında bir makale yazmaya devam etti ve araştırmasının çoğunu tekrarlamadığını, ancak çok sayıda kelimeyi yeniden ifade ettiğini belirtti.

Sadece birkaç önemli gerçeğe ulaşmak ve gözüme çarpan herhangi bir şeyi takip etmeyi planlamak istediğim bu tür bir soru için Perplexity yöntemi favorim oldu. ChatGPT'den daha ayrıntılıdır ancak her biri kendi alıntı bağlantısına sahip, güzel numaralandırılmış bir liste halinde düzenlenmiştir.

Aslında diğerlerini suçlayamam ama üslup soruya uyuyor.

Nüfus ve sayılar

Temel gerçekler ve daha kesin karşılaştırmalar hakkında soru sorarken bu liste yaklaşımı her zaman istediğiniz şey olmayabilir. Yapay zeka sohbet robotlarının hızlıca araştırabileceği ancak daha sonra karşılaştırma yapması gereken iki ilgili gerçeği sordum ve şu komutu kullandım: "Yeni Zelanda'nın Auckland şehrinin mevcut nüfusu nedir ve *1950'den bu yana nasıl büyüdü?"*

İlginçtir ki, Auckland'daki nüfusu 1,711,130 olarak bildiren Perplexity ve ChatGPT ile 130 kişi daha az olduğunu bildiren Claude ve Gemini arasında bir tutarsızlık vardı. Ancak 1950 yılı nüfusu konusunda hepsi aynı fikirdeydi.

Ancak her birinin bilgiyi sunma biçimi açısından Claude'un anlatımsal yanıtını beğendim; ChatGPT'nin eksik olduğu ve Gemini ile Perplexity'nin listelere koyduğu nüfus değişimine dair birçok ayrıntıyı içeriyordu.

ne oluyor?

Üçüncü testim için, bu sistemlerin belirli bir konum ve zamana ilişkin bilgileri işleme becerisini zorlayabilecek bir şey ortaya koymak istedim; bu, hafta sonu gezisi planlarken veya misafir ağırlarken kullanabileceğiniz türden bir sorgudur.

İşte yapay zeka asistanlarının zorluğu burada ortaya çıkıyor. Tarihsel gerçekleri veya genel bilgileri bilmek bir şeydir, ancak belirli bir zamanda belirli bir yerde ne olup bittiğini bilmek bambaşka bir şeydir.

Bu, teorik bilgi ile yerel bilgi arasındaki farktır ve tarihsel olarak, yapay zeka sistemleri ikincisinden ziyade birincisinde çok daha iyi olmuştur.

Hiçbir özel sebep olmaksızın, her zaman keyif aldığım bir şehri seçtim ve sordum: Önümüzdeki hafta sonu Vancouver, British Columbia'da hangi kültürel etkinlikler gerçekleşecek?

Bu konuda bazı gerçek farklılıklar vardı. Hem Perplexity hem de Claude, numaralandırılmış bir liste ve daha sohbet havasında bir tartışma sunarak özlü anlatımlarını ve üsluplarını korudular. Ancak Claude derin olmaktan ziyade belirgin bir şekilde daha genişti ve Perplexity'ye daha çok benziyordu.

İkizler rakiplerinden tamamen saptı ve temelde cevap vermeyi reddetti. Gemini, benzer etkinlik ve aktivite listelerini paylaşmak yerine gidilecek yerleri bulmak için stratejiler önerdi. Resmi turizm sitelerini ve Eventbrite sayfalarını kontrol etmek fena fikir değil, ancak bunlar basit bir öneri listesi olmaktan çok uzak. Sanki normal bir Google araması yapıyormuşum gibi.

Bu arada ChatGPT, Gemini'den beklediğim yanıtı verdi. Etkinlik açıklamaları kısa kalsa da, yapay zeka, tarih ve konumlarıyla birlikte belirli etkinliklerin kapsamlı bir listesini, Plus Knowledge bağlantılarını ve hatta bağlantılarda bulabileceklerinizin küçük resimlerini içeriyordu.

Hava durumunu kontrol edin

Dördüncü testim için, muhtemelen tüm yapay zekalar arasında en çok sorulan soruyu seçtim; ancak kullanışlı olabilmesi için gerçek zamanlı verilere ihtiyaç duyuyor: hava durumu. Hava durumu tahminleri, sürekli güncellenmeleri, geniş çapta erişilebilir olmaları ve doğrulanmalarının kolay olması nedeniyle gerçek zamanlı veri alımını test etmek için idealdir. Doğal bir son kullanma tarihi de vardır; Dünün tahminleri zaten güncelliğini yitirmiş durumda, bu da bilginin güncelliğini yitirdiğini açıkça gösteriyor.

Yapay zeka chatbot'a "Tokyo'da önümüzdeki üç gün için hava durumu tahmini nasıl?" diye sordum. Cevaplar Vancouver'ın sorusunun neredeyse tam tersiydi.

Claude önümüzdeki üç gün boyunca çeşitli zamanlardaki hava durumu hakkında faydalı bir metin özeti sağladı, ancak bundan ibaret. ChatGPT her gün için hava durumu özetinin yanında küçük bir güneş veya bulut simgesi gösteriyordu, ancak Perplexity'nin gökyüzünün nasıl görüneceğine uyan sıcaklığı gösteren çizgi grafiğini gerçekten beğendim.

Hiçbir eklentiye ihtiyaç duymadan, rengarenk infografiğiyle beni kendine hayran bırakan Google Gemini oldu. Mevcut ve yaklaşan hava durumunu bilmeyi düşündüğümde, ihtiyacım olan veya istediğim tek şey bu oluyor.

Daha fazla ayrıntı sormak isteseydim sorardım, ama hava durumu hakkında soru sormam, uygun kıyafetimi nasıl seçeceğimi en azından bilmem gerektiği anlamına geliyor.

film eleştirmeni

Son testimde, yapay zeka destekli arama motorlarının bir konu hakkında birden fazla bakış açısı bulma ve bunları tutarlı bir genel bakışa dönüştürme konusunda nasıl performans göstereceğini görmek istedim. Bu görev esnek araştırma ve farklı bakış açılarını anlama yeteneği gerektirir. Bir istekle nasıl sonuçlanacağını görmeye karar verdim: Son filminiz hakkında profesyonel eleştirmenlerin yorumlarını özetleyin. Paddington".

Uygulama, gerçekçi hatırlama ve önemli nüansları kaybetmeden birden fazla kaynaktaki örüntüleri ve temaları tanımlama yeteneği gerektiriyordu. Bu, basit bir fikir topluluğu ile eleştirel fikir birliğini bünyesinde barındıran düşünceli bir sentez arasındaki farktır.

Gemini ve Perplexity, çeşitli eleştirmenlerin artılarını ve eksilerini sıraladığı, özet olarak yararlı olmasa da bilgilendirici olan olağan listeleriyle yola çıktılar. Garip bir şekilde, ChatGPT bu talebe en uzun cevabını, benzer bilgileri ve bunun nasıl değerlendirildiğine dair bir sonucu kapsayan kısa bir deneme olarak yazdı; ancak üslubu, bir ortaokul öğrencisinin temel paragraf yapısını öğrenmesini anımsatıyordu: konu cümlesi, destekleyici cümleler ve sonuç.

Claude'un kesinlikle en güçlü tepkisi vardı; en üstte bir özet, ardından açıklamalar ve eleştirmenlerin söylediklerine atıflar vardı. Sanki bir eleştirmenin kısa, hayal gücünden uzak bir incelemesi gibiydi; alıntı yaptığı eleştirmenlerin sözleriyle yumuşatılmış gibiydi. Filmden beklentilerimi nasıl sınırlayacağımı daha iyi anladığımı hissederek ayrıldım. Paddington, Peru'da Başkalarına göre daha iyiydim.

Arama için chatbot sıralaması

Kendi araştırmalarımla yapay zeka sohbet robotlarını test ettikten sonra, onların güçlü ve zayıf yönleri hakkında net bir anlayışa sahip oldum. Denediğim en iyi chatbotlar arasında ChatGPT, Gemini, Perplexity ve Claude yer alıyor.

Aslında hiçbiri kötü değil, ancak biri bana çevrimiçi araştırma ve bilgi toplama konusunda ilk veya son hangisini denemeleri gerektiğini sorsaydı, nasıl cevap vereceğimi biliyorum.

Google'ın arama motoru olarak bilindiğini düşünürsek, Gemini benim için son sırada geliyor ki bu biraz şaşırtıcı. Ancak etkinlik takvimini idare edememesi, iyi performansına rağmen kendisinden uzak durmama neden oldu.

Benim için bir diğer sürpriz ise ChatGPT'nin üçüncü sırada yer alması. En çok kullandığım ve yakından tanıdığım yapay zeka sohbet robotu bu ama genelde beğendiğim kısa cevapları, araştırma bağlamında çok kısıtlı geldi. Modeli değiştirmenin veya kelime sayısını ayarlamanın bu sorunu çözeceğinden eminim, ancak yapay zeka konusunda yeniyseniz ve henüz bilmiyorsanız, çok fazla takip sorusu sormak iyi bir fikir değildir.

Bu Perplexity'nin bir sorunu değil. Numaralandırılmış listeler çok açıktı ve alıntılar neredeyse kapsamlıydı. Benim için en büyük dezavantajı, istemde herhangi bir ek seçim yapılmadan tekrar arama motoruna dönmesi. Paylaştığı bilginin nereden geldiğine dair kanıt sunması hoşuma gidiyor, ancak bilgiyi yapay zekadan almak yerine bağlantıya tıklamaya fazla hevesli görünüyor.

Claude'un bu listenin başında olacağını beklemiyordum. Claude'u genel olarak iyi bir yapay zeka sohbet robotu bulmama rağmen, her zaman rakiplerinin gerisinde kaldığı hissine kapıldım; belki onlar kadar iyi ama bir şekilde farklıydı. Bu his bu test sırasında kayboldu.

Cevapların biraz uzun olması veya bir veya iki cümlenin yeterli olacağı yerde daha geniş bir makaleye dikkat edilmesini gerektirmesi gibi kusurlar vardı. Ama Vancouver'daki tüm olayları açıklayan tutarlı bir anlatı olması veya bir film eleştirisi üzerine yazılmış bir deneme olması hoşuma gitti. Paddington, Peru'da Kendini tekrar etmeden.

Yapay zeka asistanları birer araçtır, yalnızca bir kişinin kazanabildiği bir realite şovunda yarışmacı değildir. Farklı görevler farklı yetenekler gerektirir. Sonuç olarak, dört yapay zekalı sohbet robotundan herhangi biri ve arama özellikleri faydalı olabilir, ancak Claude Pro için ayda 20 dolar ödemeye ve arama özelliklerine erişmeye razıysanız, aradığınız şeyin bu olduğunu söyleyebilirim.