OpenAI, yeni bir gelişme ile daha karşımızda. GPT-4o modelini kullanarak görsel oluşturma özelliği geliştirip güncelledi. Üstelik ChatGPT’yi kullananlara iyi bir haber: Özellik hem ücretli hem de parasız kullanıcılar için açık.
O vakit ikimiz de ChatGPT, kendini ne kadar geliştirdi deyip hazırlamış olduğumuz görselleri öteki görsel oluşturma araçlarıyla karşılaştıralım dedik.
Listemizde ChatGPT ile karşı karşıya gelen yapay zekâ araçları ise Microsoft Designer, Grok, Midjourney, Deepai ve ideogram. Aynı prompt’ları kullanarak verdiğimiz karşılaştırma neticelerini aşağıda bulabilirsiniz. İyi olan kazansın!
Çay ve simit keyfini bir de görselleştirelim dedik. İşte girdiğimiz prompt:
ChatGPT görseli:

Kendisi simitin de çayın da ne işe yaradığını biliyor. “Simidi iyi mi bilmez!” demeyin. Birazdan ne demek istediğimizi anlayacaksınız. O klasik çay tabağından ortama kadar bizce başarıya ulaşmış ve tatminkar bir görsel.
Deep görseli:

Simit nerede? Bahsettiğimiz bu detaydı fakat dahası da gelecek öteki görsellerde. Birazcık fazla yapay değil mi?
Microsoft Designer görseli:

Hadi su bardağında çay içmek bizim için düzgüsel bir şey sadece nerede simit, nerede Türk detaylar. Çatal aslına bakarsanız kendinden geçmiş. Parasız görselde Microsoft Designer üzdü!
İdeogram görseli:

Simit değil de pişi koyarak bir nebze gözümüzü doyursa da gene tam olarak istenilen şey çıkmadı. Kahve tarafındaki lokum detayı da gözden kaçmadı fakat mevzumuz o değil. Samimi ortam oldukça organik fakat keşke bu doğallığı çaytan tüten dumanda da görebilseydik.
Grok görseli:

Simit yapmak ne kadar zor olabilir ki? Ek olarak Grok’ta filigram detayı karşımıza çıkıyor. ChatGPT, yeni güncellemesinde bu detayın olmayacağının altını çizmişti.
Midjourney görseli:

Kaliteli mi? Evet. Simit nerede? Yok. Bardak gene su bardağı benzer biçimde olsa da bizce görsel kalitesi tatminkar.
Duygusallıktan kamera açısına kadar her detayı verdiğimiz ikinci prompt:

ChatGPT görseli:

Deep görseli:

Üçüncü bir telefon, içine geçmiş bir bardak ve neye benzediği belli olmayan kulaklıklar!
Microsoft Designer görseli:

Gene bir üçüncü telefon daha. Eldeki kaymalar ve birazcık yapaylıktan uzak olsaydı iyi olurdu.
İdeogram görseli:

Kulaklık benzer biçimde bazı bilgileri saymazsak ChatGPT hariç öteki görsellerden daha iyi diyebilir miyiz?
Grok görseli:

Telefonun kayık olması haricinde gerçeğe yakın. Gene Grok filigranı ufak de olsa göz tırmalıyor. Silgi araçları çıksın ortaya!
Midjourney görseli:

Her ne kadar kulaklık gereksiz büyük olsa da bakıştan telefonlara kadar bu da bizim için doyurucu.
Size nazaran ChatGPT’in yeni görsel oluşturma kabiliyeti iyi mi? Birinci olduğu kati fakat ikinci kim dersiniz?



