GPT-5, GPT-4o’dan Daha Fazla Halüsinasyon Görüyor

Aralık 12, 2025

1

Yeni bir halüsinasyon testine bakılırsa OpenAI’ın yeni modeli GPT-5, GPT-4o’ya kıyasla daha çok halüsinasyon görüyor. En fazlaca halüsinasyon gören model de pek şaşırtıcı değil.

OpenAI, geçtiğimiz hafta yeni modeli GPT-5‘i kullanıma sunmuştu. CEO Sam Altman, bu yeni modelin bugüne kadarki en kuvvetli, süratli ve güvenilir sürüm bulunduğunu söylerken, “halüsinasyon” dediğimiz, suni zekânın uydurmuş olduğu bilgilerin de bu modelle fazlaca daha azca olacağının altı çizilmişti.

Vectara isminde bir platform ise bu iddiaları kontrol etti. Sonuçlara bakılırsa GPT-5, halüsinasyon oranında GPT-4’ten daha iyi olsa da fark fazlaca ufak. Teste bakılırsa GPT-4’ün %1,8’lik oranı, GPT-5’te %1,4’e düşmüş. GPT-4o ise %0,09 farkla GPT-5’in önünde. En iyi netice ise %0,795 ile OpenAI’nin o3-mini High Reasoning modelinde.

En fazlaca halüsinasyon gören model ise Grok-4

Gene de GPT-5 hâlâ rakiplerinden fazlaca daha güvenilir durumda. Mesela Google’ın Gemini-2.5-pro’su %2,6, Grok-4 ise %4,8 oranında halüsinasyon görüyor.

Grok’un arkasındaki şirket xAI, son zamanlarda ünlülerin uygunsuz deepfake videolarını kolayca üretebilen “Spicy” modu yüzünden eleştirilerin odağında. Ek olarak verileri X’e dayalı olduğundan halüsinasyon oranını düşürmekte zorlanıyor.

Peki sizce en düşük halüsinasyon oranı hangi modelde? Düşüncelerinizi aşağıdaki yorumlar kısmından bizimle paylaşabilirsiniz.

Önceki İçerik

Take-Two CEO’sundan GTA 6 Ertelemesi Sonrası İlk Izahat

Sonraki İçerik

Tek Bir Sahne İçin En Fazla Yeniden Çekim Hangi Filme Ilişkin?

CEVAP VER İptal

Lütfen yorumunuzu giriniz!

Lütfen isminizi buraya giriniz

Yanlış bir e-posta adresi girdiniz!

Lütfen e-posta adresinizi buraya girin

GPT-5, GPT-4o’dan Daha Fazla Halüsinasyon Görüyor

Yeni bir halüsinasyon testine bakılırsa OpenAI’ın yeni modeli GPT-5, GPT-4o’ya kıyasla daha çok halüsinasyon görüyor. En fazlaca halüsinasyon gören model de pek şaşırtıcı değil.

En fazlaca halüsinasyon gören model ise Grok-4

Yapay Zeka, İş Yükünü Azaltacağına Artırdı mı?

Google’dan Yeni Model: Gemini Embedding 2 ile Metin, Görüntü ve Ses Tek Bir Modelde!

OpenAI’ın Video Aracı Sora, ChatGPT’ye Dâhil Ediliyor: Söyleşi Ederek Video Üretmek Mümkün Olacak!

CEVAP VER İptal

Most Popular

Whicons – White Icon Pack v20.1.272 APK Free Download

Yeni Nesil Peugeot 308 Türkiye’de: İşte Fiyatı

iPhone 12’nin Kamera Tasarımı iPhone 16 ile Geri Dönüyor

IMDb Puanlarına Nazaran En İyi Yerli Diziler

Recent Comments

EDITOR PICKS

Whicons – White Icon Pack v20.1.272 APK Free Download

Yeni Nesil Peugeot 308 Türkiye’de: İşte Fiyatı

iPhone 12’nin Kamera Tasarımı iPhone 16 ile Geri Dönüyor

POPULAR POSTS

Whicons – White Icon Pack v20.1.272 APK Free Download

Yeni Nesil Peugeot 308 Türkiye’de: İşte Fiyatı

iPhone 12’nin Kamera Tasarımı iPhone 16 ile Geri Dönüyor

POPULAR CATEGORY

ABOUT US

FOLLOW US