Dünyayı anlamak için Gemini Live bedenlenmesini deneyimledim: Şok!

Bir yapay zekanın garip bir şekilde dostça bir tonda konuşup benden iş istasyonumdaki karmaşayı temizlememi istemesi sinir bozucu. Bununla gurur duyuyorum, ancak sanırım rastgele dağılmış aletleri istiflemenin ve kablo karmaşasını temizlemenin zamanı geldi.

Ablam da aynı fikirde olurdu. Ancak yapay zekanın masamı "görmesi", dağınıklığı tanıması ve ev temizliği konusunda ipuçları vermesi sonrasında harekete geçmek daha büyük bir resim. Google'ın Gemini AI chatbot'u artık tam da bunu yapabiliyor. Ve çok daha fazlası.

Buradaki gizli sos, Project Astra adı verilen son özellik güncellemesidir. Yıllardır geliştirilme aşamasındaydı ve sonunda bu ayın başında kullanıma sunuldu. Ana fikir, telefonunuzda her şeyi gören, her şeyi duyan ve açıkça zeki bir yapay zeka sunmaktır.

Google bu süper güçleri pek de ilham verici olmayan bir isim altında pazarlıyor: Gemini Live with Camera and Screen Sharing. Şirketin DeepMind birimi tarafından geliştirilen uygulama, evrensel bir yapay zeka asistanı olarak geliştirilmeye başlandı. Yazık ki son isim iddialı değil.

Gemini Live'ın kamera ve ekran paylaşımı içeren ana ekranı.

Erişim modundan başlayalım. Bu yetenek artık kullanıcıların kullanımına sunuldu. piksel 9 و Galaxy S25. Ancak Gemini Advanced aboneliğiniz olan bir Android telefonunuz varsa, yeni araç setine erişebilirsiniz.

Bu arada, bu ayda 20 dolar demek. Yukarıdaki iki telefonda denedim ve artık OnePlus 13'ümde de çalışıyor. En tatlı kısmı? Oraya ulaşmak için hiçbir teknik engeli aşmanıza gerek yok.

Gemini'yi çağırmak için güç/ses tuşlarını bir arada kullanmanız veya ekranın köşesini kaydırmanız yeterli. Hangi uygulamayı çalıştırıyor olursanız olun, işletim sisteminin her köşesinde yeni bir kamera ve ekran paylaşımına bir katman olarak erişebilirsiniz.

Çevrenizdeki dünyayı anlamak

Bir tabloya kamerayı doğrultup onun hakkında sorular sormaya başladım. Gemini Live, cesur renk kullanımı ve hayvan tasvirlerinden yola çıkarak eserin Madhubani tarzı bir resim olduğunu doğru bir şekilde tespit edebildi.

Gemini Live'da kamera ve ekran paylaşımı ile resimleri tanımlayın.

Daha sonra bana tarih ve yıllar içinde gelişen farklılıklar hakkında kısa bir ders verdi. Bilgiler en ufak ayrıntısına kadar doğruydu. Neyse ki, sesli konuşmaların rahatsız edici olabileceği bir yerdeyseniz, Gemini ile metin tabanlı bir sohbet de yapmayı seçebilirsiniz.

Gemini Live'ın yeni kamera ve ekran paylaşım özelliğinde en çok hoşuma giden şey aşırı sohbet havasında olmaması. İstediğiniz zaman araya girebilirsiniz, bu da "doğal" konuşmaların çekiciliğini artırır.

Gemini'yi çeşitli senaryolarda denedim. Buna hazırlıklı değildim.

Verdiği cevaplar genellikle kısadır, sanki size fazla uzun bir cevap vermek yerine, bir takip sorusu sorma şansı (veya hatta bir dürtme) vermek ister gibi. Çok çeşitli görsel temalar ve senaryolarda mükemmel ama bazı tuzakları da var.

Gemini Live ile kamera ve ekran paylaşımı ile metin üzerinden konuşma.

Henüz Google Lens'i kullanamıyor, bu da Gemini'nin telefon ekranınızda gördüğü görüntüleri web'deki eşleşen sonuçlarla karşılaştıramayacağı anlamına geliyor. Ayrıca İkizler burcundan bir konu veya karakter hakkındaki son gelişmeleri aramasını istediğinizde gerçek zamanlı bilgilere erişemeyebilir.

Kendisine bitki türleri, restoran menüleri, ilan panolarından alınan veriler ve yakın zamanda geçirdiğim grip için kullandığım reçete hakkında sorular sordum. Gemini, şu ana kadar deneyimlediğim tüm yapay zeka sohbet robotlarından daha iyi bir performans sergiledi.

Bilgi Bankasını Serbest Bırakmak: Derinlemesine Bir Analiz

İkizler burcu sizi karmaşık akademik konuları anlamaya zorlar. Makine Öğrenmesi ile ilgili bir kitabı kamera kadrajına koydum. Gemini Live bunu fark etmekle kalmadı, aynı zamanda kitabın içeriği ve ana temaları hakkında bana genel bir bakış da sundu. Bu yetenek, Makine Öğrenmesi konusunda ileri düzeyde bir anlayışa ve karmaşık bilgileri özetleme yeteneğine sahip olmayı yansıtır.

Gemini Live ile kamera ve ekran paylaşımıyla Hintçeyi anlayın.

Merakla sayfaları çevirmeye başladım ve bölüm listesine rastladım. Yapay zeka ilerlemeyi fark etti, konuşmayı bıraktı ve konu listesini kontrol ettiğim şu anda herhangi bir dersle ilgilenip ilgilenmediğimi sordu. Bu özellik, Gemini'nin kullanıcı etkileşimlerine gerçek zamanlı olarak uyum sağlama ve yanıt verme yeteneğini ortaya koyarak onu etkileşimli öğrenme için güçlü bir araç haline getiriyor.

O an çok şaşırdım.

Yapay zekadan bazı karmaşık konuları analiz etmesini istedim ve o da sayfadaki materyalin ötesine geçerek kendi geniş bilgi bankasından yararlanarak saygın bir iş çıkardı.

Örneğin, Bhisham Sahni'nin "Tamas" adlı romanının giriş sayfasının içeriğini sorduğumda, AI, Sahitya Akademi Ödülü'ne yapılan atıfı doğru bir şekilde yakaladı. Daha sonra sayfada yer almayan ayrıntılara, örneğin prestijli edebiyat ödülünü hangi yıl kazandığına ve romanın ne hakkında olduğuna değindi. Bu, yapay zekanın bağlamı anlama ve ek bilgi çıkarma yeteneğini göstermektedir.

Öte yandan Gemini Live ile Hintçe okumak korkunçtu. Sadece kötü bir aksan değildi bu, İkizler burcunun sık sık saçma sapan şeyler söylemesiydi. Urduca, Farsça ve Arapça okumaya çalışırken çok daha iyi bir iş çıkarıyordu, ancak rastgele satırlardaki kelimeleri sık sık karıştırıyordu. Bu, Gemini'nin performansının dillere göre değiştiğini ve bazı dillerde önemli geliştirmelere ihtiyaç duyabileceğini gösteriyor.

Gemini Live'ı kullanarak kamera ve ekran paylaşımıyla Urduca okuma.

Urdu şiiriyle ilk denememde, sadece Urduca metni tanımakla kalmadı, aynı zamanda şiirin doğru bir özetini de verdi. En büyük zorluk yine anlatımdı. Urducanın İngilizce versiyonunu duymak kulaklarımı gerçekten acıttı. Bu durum, özellikle yabancı dillerle uğraşırken kullanıcı deneyiminde telaffuz ve aksan kalitesinin önemini vurguluyor.

beklenmedik yerlerde üstün başarı gösterir

Yapay zeka harika bir problem çözme aracıdır ve bunu kanıtlayan birçok ölçüt bulunmaktadır. Bunu el yazısıyla yazılmış bir defterde çıkan termodinamik, elektrokimyasal denklemler ve istatistikle ilgili fizik problemleri üzerinde denedim. Gemini Live bu görevlerde harika bir iş çıkardı.

Yaratıcı görevlerde bile başarılıydı. Moda tasarımcısı olan kız kardeşim, çizimlerinden birini kameraya göstererek geri bildirim ve iyileştirmeler istedi. Gemini Live, tasarıma övgüler yağdırarak, birkaç moda markasının tasarım ideolojileriyle karşılaştırmalar yaparak ve birkaç öneri sunarak başladı. Bu öneriler tasarımın iyileştirilmesinde oldukça faydalı oldu.

Gemini Live ile kamera ve ekran paylaşımı ile kitap taraması.

AI, Plus'ı tanıtmaya yönlendirildiğinde, kız kardeşime elle çizilmiş çizimleri dijital konseptlere dönüştürmek için en iyi araçlar konusunda da tavsiyelerde bulundu. Bu tavsiyelerin ardından, yazılım paketi ve eğitim materyallerinin nerede bulunabileceği hakkında faydalı bilgiler verdi. Bu tavsiyeler, dijital tasarım sürecini hızlandırmada paha biçilmezdi.

Duracell pil çiftini kameranın görüş alanına yerleştirdiğimde, pilleri doğru bir şekilde tanımakla kalmadı, aynı zamanda bunları bana birkaç dakika içinde teslim edebilecek yerel e-ticaret platformları hakkında da bilgi verdi. Bu yetenek, özellikle ürünlerin ve bunların yerel olarak bulunup bulunmadığının belirlenmesinde oldukça faydalı olmuştur.

Blinkit ve Swiggy Instamart adı verilen hizmetler yalnızca Hindistan'da mevcut ve çoğunlukla kentsel alanlara yönelik. Loş ışıklı bir odada bile, ilk denemede kablolu bir kulaklığı tanımlamayı başardı. Bu, yapay zekanın nesneleri farklı koşullarda tanıyabilme yeteneğini ortaya koyuyor.

Durumsal farkındalık onun en büyük gücüdür.

Gemini Live sohbetleri, normal bir Gemini sohbetine veya Google Arama'nın AI genel bakış bölümünde bulduğunuz şeylere kıyasla, özellikle hassas nitelikteyse, bilginin dağıtımında daha temkinli bir yaklaşım sergiliyor. Beslenme önerileri ve tıbbi tedavi gibi konuların giderek daha temkinli bir yaklaşımla ele alındığını, kullanıcıların genellikle uygun uzman kaynağına yönlendirildiğini fark ettim. Bu uyarı, Google'ın özellikle uzmanlık gerektiren alanlarda doğru ve güvenilir bilgi sağlamaya odaklandığını yansıtıyor.

Bazı tanıdık zorluklar

Gemini Live'da kamera ve ekran paylaşımı ile bir çıkartmanın taranması.

Vardığım en önemli sonuç, Project Astra'nın Gemini'ye dönüşümünün çok etkileyici olduğudur. Akıllı telefonların gelecekte neler başarabileceğine dair bir bakış. Bazı iyileştirmeler, entegrasyonlar ve uygulamalar arası iş akışlarıyla Google Arama sizi bir kalıntı gibi hissettirebilir. Ancak şu anda bazı bariz kusurlar var.

Birkaç kez hafıza sistemimin kontrolden çıktığını fark ettim. AI'dan kamera görünümünde bir fitness bandını tanımlaması istendiğinde, bunu doğru bir şekilde Samsung Galaxy Fit 3 olarak tanımladı. Ancak takip eden bir soru sorduğumda, cihaz yanlışlıkla bir Huawei fitness bandı olarak tanımlandı.

Aynı zamanda açıkça yalan da söyleyebilir. Ve tam bir güvenle diyebilirim. Örneğin giyilebilir cihaz hakkındaki incelememi özetlemesini istediğimde, yapay zeka Digital Trends'in henüz incelemediğini söyledi. Aslında makale bir hafta önce yayınlanmıştı.

Daha sonra ekran paylaşımını aktif hale getirdikten sonra yazar sayfamdaki bazı makalelere göz atmasını istedim. İkizler burcu hikayeleri açıklamada iyi bir iş çıkardı ancak bazen bağlamı anlamakta tökezledi. Örneğin, yalnızca Intel ve AMD'nin Sinir İşleme Birimleri'nin (NPU) rozet için uygun hale getirilebileceği yanlış bir şekilde belirtildi. Yardımcı pilot+.

Gemini Canlı Yayını için kamera ve ekran paylaşımı uyarısı.

Öte yandan makalede Qualcomm'un rakiplerinden önce bu standardı karşılayan ilk şirket olduğu açıkça belirtiliyor. AMD ve Intel'in yeni işlemci serileriyle yapay zeka çipi temeline ulaşmaları ancak geçen yılın sonlarına doğru mümkün oldu.

Bir makale üzerine sohbetin ortasında yine hafıza sorunu yaşadı. Tartışılan haberi özetlemek yerine, ekran paylaşımı yoluyla gördüğü ilk makaleden bahsetmeye geri döndü. Anlatımının ortasında sözünü kestiğimde Gemini hatasını düzeltti.

İngilizce dışındaki dillerdeki anlatımlarda fark ettiğim bir diğer sorun da Gemini Live'ın anlatım sırasında sesi ve hızı rastgele değiştirmesiydi. Bu durum son derece sinir bozucuydu ve telaffuzu tamamen robotikti, insanın kullandığı İngilizce dil becerilerinden tamamen farklıydı.

Gemini Live ile kamera ve ekran paylaşımı eşliğinde bir pasajı okuyun.

Düzgün çizgilerde de makine görüşü zorlukları ortaya çıkıyor. Birkaç kez kendinden emin bir şekilde yanlış bilgi tükürdü ve kendisini düzeltmesi istendiğinde ise yapay zeka, konuyla ilgili en güncel bilgiyi bulma konusunda yetersiz kaldığını dile getirdi. Bu senaryolar nadirdir, ancak İkizler burcunun hataları devam eder.

Özetle, Gemini Live'ın kamera ve ekran paylaşımı özelliğiyle şu ana kadar yapay zekanın yaptığı en büyük sıçramalardan biri olduğunu düşünüyorum. Üretken yapay zekanın bugüne kadarki en pratik ve ödüllendirici uygulamalarından biridir. İhtiyacı olan tek şey biraz çeşitlilik ve "kendine güvenen yalancı" sendromuna bir çözüm.

İşler kesinlikle doğru yolda, çoğunlukla, ancak teknoloji-fütürist hayaller için mükemmel bir yapay zeka arkadaşı olmaktan hâlâ birkaç kritik kilometre taşına uzağız.

Yoruma kapalı.