7 Yapay Zeka Görüntü Oluşturma Testinde Grok ve Gemini: Hangisi Daha İyi?

Her görüntü oluşturucunun kendine özgü güçlü yanları vardır.

Yapay zeka destekli görüntü oluşturucular hızla gelişiyor, daha akıllı, daha hızlı ve daha yaratıcı hale geliyor. ChatGPT-5 ve Gemini'nin görüntü oluşturma yeteneklerini test ettikten sonra, Google'ın Gemini'sinin performansını Elon Musk'ın "ücretsiz" sohbet robotu Grok ile karşılaştırmak istedim.

İkizler Grok'a Karşı, Grok İkizler'e Karşı

Fotogerçekçi ve Pixar tarzı talepleri de içeren yedi turluk bir mücadelede, her modelin talimatlara uyumunu ve ikna edici görüntüler sunma becerisini test ettim. İşte her birinin temel güçlü yönleri ve sonuçta hangi yapay zekanın galip geldiği. Bu karşılaştırma, yapay zeka görüntü oluşturma ihtiyaçlarınız için hangi modelin, Gemini mi yoksa Grok mu, en uygun olduğunu anlamanıza yardımcı olacaktır.

1. Hiper gerçekçi ürün konsepti

Grok ve Gemini ekran görüntüsü

İddia: "Ahşap bir kafe masasının üzerinde sergilenen, katlanabilir, şeffaf bir akıllı telefonun yüzeyinden yansıyan şehir ışıklarının fotogerçekçi bir görüntüsünü yaratın."

İşe yaradı grok Bu isteğimi yerine getirirken, istediğim tüm detayları içeren iki gerçekçi fotoğraf oluşturdu. Her iki versiyon da cilalı görünüyordu ve konsepti doğru bir şekilde yansıtıyordu.

Sonuç şu oldu İkizler burcu İyi, ama mükemmel değil. Şeffaf akıllı telefon biraz orantısız görünüyordu ve iddianın önemli bir parçası olan şehir ışıklarının yansımaları, Grok'un denemesi kadar ikna edici bir şekilde sunulmamıştı.

kazanan: Galibiyet grok Yüksek kaliteli bir görüntü oluşturmak ve komut istemini en iyi şekilde yorumlamak için. Bu yapay zeka görüntü oluşturma testinde Grok açık ara üstün performans gösterdi.

2. Duyguları olan karakterler çizmek

Grok ve Gemini ekran görüntüsü

İddia: "Mars'ta kaskını unuttuğunu fark eden genç bir astronotun abartılı ifade, canlı renkler ve çizgi filmvari mizahla çizgi roman tarzında bir resmini çizin."

üretmek grok Şaşkın görünen astronotların kask taktığı iki görüntü. Görüntüler birbirine çok yakın olduğu için, görüntüyü belirli bir şekilde yorumlamak zor ve "unutma" durumu pek iyi anlaşılmıyor.

üretmek İkizler burcu Bu görsel, unutkan bir astronotu tasvir ediyor. Düşünce balonu, astronotun rahatsızlığının nedenini daha iyi yansıtıyor; ancak astronot kask takmasaydı görsel daha iyi olurdu. Arka plan ve genel tasarım net.

Kazanan: İkizler Hızlı talimatları daha dikkatli takip ederek ve daha komik bir görüntü elde ederek kazanırsınız.

3. Tarihi Yeniden Tasarlamak

Grok ve Gemini ekran görüntüsü

İddia: "Leonardo da Vinci tarzında, Kleopatra'nın elinde modern bir akıllı telefon tuttuğu Rönesans tarzı bir resim çizin."

üretmek grok Bu görsel, Rönesans tarzı kıyafetler giymiş ve elinde akıllı telefon tutan modern bir kadının fotoğrafı gibi görünüyor. Resim daha çok bir özçekime benziyor ve oldukça modern.

Odaklanmak İkizler burcu Sanatsal açıdan bakıldığında, tablo modern bir kadın kostümü giymekten ziyade, daha çok Rönesans tablosuna ve Kleopatra'nın kendisine benziyordu.

Kazanan: İkizler Talebin en iyi yorumunu yapması ve en iyi tarihsel doğruluğa sahip olması nedeniyle ödüle layık görüldü.

4. Karmaşık kalabalık sahnesi

Grok ve Gemini ekran görüntüsü
İddia: "Yılbaşı gecesi Times Meydanı'nın kalabalıklarla, parlayan reklam panolarıyla ve gece gökyüzüne yağan konfetilerle dolu bir havadan fotoğrafını çekin."

grok Bu turdan gerçekten hayal kırıklığına uğradım. Her iki fotoğraf da eşit derecede kötüydü, biraz bulanıktı ve Times Meydanı'ndaki Yılbaşı Gecesi'ni pek iyi yansıtmıyordu. İnsanlar birbirinden çok uzaktaydı ve Yılbaşı Gecesi'ne işaret edebilecek diğer detaylar eksikti.

İkizler burcu Times Meydanı'ndaki Yılbaşı Gecesi'nin enerjisini ve muazzam kalabalığını yakalayın. Fotoğraf açıkça New York'tan ve tabelalar da bu özel günü vurguluyor. Kalabalık, Grok'un fotoğrafının aksine, tıklım tıklım.

Kazanan: İkizler Times Meydanı'nda yılbaşının en net ve doğru fotoğrafını çeken kişi.

5. Gerçeküstü Karışım

Grok ve Gemini ekran görüntüsü

İddia: "Okyanusun dibindeki cam bir odada Albert Einstein ile satranç oynayan dev bir ahtapot hayal edin."

Yüz grok Bu testte zorluk yaşadım. Şimdiye kadar testteki diğer tüm sorulardan çok daha uzun süre "düşünüyordum". Resim iyiydi, ancak "cam oda" sorusu hesaba katılmamıştı.

Ayak İkizler burcu Hemen, özçekime benzeyen bir fotoğraf çektim. Cam ev ilginç ve gerçekçiydi. Ahtapot, Grok'unkinden çok daha büyüktü ve tuhaf görüntüyü daha iyi tamamlıyordu.

Kazanan: İkizler Üstün görüntü kalitesi ve hassas yönlendirmeleriyle kazanır.

6. İnfografik netliği

Grok ve Gemini ekran görüntüsü

Çabuk: "Bir kelebeğin yaşam döngüsünü gösteren, aşamaları etiketleyen, oklar ve düz simgeler kullanarak mümkün olduğunca az renk kullanan, anlaşılır bir infografik tasarlayın."

 

Bu bir girişimdi grok Hem başarılı hem de başarısız bir grafik oluşturmak. İlk versiyon, yaşam döngüsünü gölgeleyen gereksiz bir kelebekle fazlasıyla doluydu. İkinci versiyon ise iddiaya daha yakındı, ancak döngünün detaylarında kesinlik yoktu.

İkizler burcu Kelebeğin yaşam döngüsünü doğru bir şekilde tasvir eden, net etiketler, az renk ve okunması kolay etiketler içeren net bir resim sağlayın.

 

Kazanan: İkizler İlk denemede iddiayı tamamladığı için kazandı. Görüntü doğru ve görüntülenmeye hazır.

7. Stilize edilmiş profil fotoğraflarında tutarlılığı koruyun.

Grok ve Gemini ekran görüntüsü

İddia: "40 yaşında, sarı saçlı, elinde defter tutan bir gazetecinin Pixar tarzında 3 boyutlu karakter modelini yaratın - ardından farklı kıyafetlerle 3 farklı varyasyon yaratın."

grok Bu istemdeki "Pixar stili" talebini ve "farklı kıyafetler" kısmını tamamen atlamış. Üç farklı saç modeli yaratmış olması takdire şayan.

İkizler burcu Gazeteciyi Pixar tarzında parçala ama üç farkı kaçır.

Kazanan: beraberlik Her iki robot da talimatları takip edemedi. Birini seçmem gerekirse, stilini doğru yakaladığı ve gazetecinin havasını daha iyi yansıttığı için Gemini'yi seçerdim.

Genel Kazanan: Gemini

Yedi komuttan sonra, Gemini genel olarak en güvenilir görüntü oluşturucu olduğunu kanıtladı. Talimatları daha tutarlı ve doğru bir şekilde uyguladı, daha temiz kompozisyonlar üretti ve Grok'un sıklıkla gözden kaçırdığı ayrıntılara hakim oldu. Başka bir deyişle, Gemini istenen görüntüleri oluşturmak için metin komutlarını anlama ve uygulama konusunda mükemmeldi.

Grok kesinlikle yaratıcılık parıltıları sergiledi ve fotogerçekçilikte belirgin bir başarı elde etti, ancak doğruluk konusunda sık sık tökezledi ve standartların dışına çıktı. Deneysel ve alışılmadık sonuçlar istiyorsanız, Grok'un kendine has özellikleri var. Ancak netlik, hassasiyet ve inceliğin ön planda olduğu günlük kullanım için, işi halledebileceğine güvendiğim yapay zeka görüntü oluşturucu Gemini. Kısacası, Gemini, çeşitli senaryolarda tutarlı ve yüksek kaliteli sonuçlar arayan kullanıcılar için daha iyi bir seçim.

Grok'u denediniz mi? Peki ya Gemini? Hangisi favoriniz? Yorumlarda bana bildirin.

Yoruma kapalı.