
GPT-5 her ne kadar piyasaya sürüldüğünde beklentilerin altında kalsa da birçok testte eski modellere kıyasla daha iyi durumda. Peki bu iyi sonuçlarının arkasında tam olarak ne var?
OpenAI son dönemde GPT-5‘in çıkışındaki başarısızlığı sebebiyle eleştiri oklarının hedefi oldu. Birçok kullanıcı, kişilik eksikliğine ve insanları modelden soğutan öteki değişikliklere atıfta bulunarak GPT-5’in yetersiz bulunduğunu iddia etti.
Derinlemesine araştırma şeklinde işlerle ilgileniyorsanız yada etik ya da bilimsel kavramları anlamaya çalışıyorsanız, dürüst ve direkt yanıtlar istersiniz. GPT-5 ise önceki modellere kıyasla her etkileşimde daha kısa ve öz bir tavır sergiliyor.
Bu aşamada varsayılan GPT-5 modeli isteklerinize bakılırsa en iyi modeli otomatikman seçse de, istediğiniz süre “GPT-5 Thinking” moduna geçme seçeneğiniz var ve güvenilir olun bu içeriğimizden sonrasında geçmek isteyeceksiniz. Hadi gelin, GPT-5 Thinking’in, o3 ve o4-high-mini şeklinde eski düşünme modellerine kıyasla ne şeklinde iyileştirmeler sunduğuna daha yakından bakalım.
GPT-5 eski modellerden daha çok “kişiliğe” haiz
GPT-5, GPT-4o’ya bakılırsa daha dobra ve mesafeli bir izlenim verse de gözlemlerimizde o3, o4-mini-high ve öteki eski düşünme modellerinden aslen daha çok kişilik sergiliyor.
Mesela hem o3 hem de GPT-5 ile herhangi bir mevzuda beyin fırtınası yaparken, o3 hiçbir içtenlik göstermeden direkt mevzuya girerken GPT-5 ise sohbete daha yatkın, hatta birazcık pohpohlayıcı bir tonla başlıyor. GPT-5 bu söyleşi tarzını diyalog süresince sürdürürken, o3 daha mekanik kalıyor.
Kısacası GPT-5, âdeta 4o’nun sıcakkanlılığı ile o3’ün ruhsuzluğu içinde bir denge kuruyor. Bunun iyi mi fena mü olduğu ise tamamen kullanıcının beklentisine bağlı.
GPT-5’in fikir zinciri daha derin ve anlaşılır

GPT-5 Thinking’in fikir zinciri eski modellere kıyasla oldukca daha başarı göstermiş. Meydana getirilen testlerde GPT-5 Thinking, sorgular üstünde yalnız daha uzun düşünmekle kalmıyor, bununla birlikte o3’e bakılırsa oldukca daha detaylı ve okunabilir bir fikir akışı sunuyor.
Herhangi bir senaryo üstünde o3 yalnız dört saniyede kısa bir yanıt verirken GPT-5 Thinking ise 40 saniyeyi aşkın süre içinde, her biri neredeyse tam bir paragraf uzunluğunda olan beş maddelik bir cevap üretiyor.
Sonuçların her ikisi de muhteşem olmasa da genel olarak spekülatif çıkarımlar dengeli durumda. Gene de bir çok durumda GPT-5’in yanıtlarını okuyup idrak etmek oldukca daha kolay.
Bir çok süre aynı yanıt o3’e kıyasla daha süratli geliyor

Detaylı sorgularda GPT-5 daha uzun düşünüyor olsa da direkt sorularda durum tamamen değişik. Eğer yanıt basitse GPT-5 çoğu zaman yanıtı daha süratli veriyor.
Yan yana karşılaştırıldığında o3’ün yaratıcı düşünme eğilimi, kimi zaman süratli ve net cevaplar vermesine engel olabiliyor fakat GPT-5 sorguların basitliğini daha iyi kavradığından sonuca oldukca daha süratli ulaşıyor.
GPT-5 daha azca halüsinasyon görüyor

Birçok şahıs GPT-5’in daha azca yaratıcı bulunduğunu söylüyor ve bu, Thinking modelinde bile büyük seviyede doğru. Burada es geçilmemesi ihtiyaç duyulan mühim nokta ise şu; daha azca yaratıcı olması, GPT-5 Thinking’in bir şeyler uydurma ihtimalinin de daha düşük olduğu anlamına geliyor.
Bazı yaratıcı projelerde GPT-5’in bu mekanik yaklaşımı engel oluşturabilir sadece o3’teki gereğinden fazla yaratıcılık da birçok kez hatalı sonuçlara ve halüsinasyona yol açıyordu.
GPT-5 talimatları daha iyi takip ediyor

GPT-5, talimatları uygulama mevzusunda eski modellere kıyasla oldukca daha tutarlı. o3 ve benzeri eski modeller, ya talimatları görmezden geliyor ya da bazı aşamaları atlıyordu. GPT-5 ise istediğiniz şeyi yapma mevzusunda oldukca daha başarı göstermiş.
Doğrusu oldukca net komutlar içeren sorgularınızda GPT-5 çoğu zaman daha etkisi altına alan sonuçlar sunuyor sadece söyleşi yada yaratıcılık gerektiren mevzularda hangi modelin daha iyi netice vereceği birazcık size ve şansa kalmış bir durum.
Netice olarak GPT-5, beklentilerin oldukca yükseltilmesi sebebiyle birazcık bu beklentilerin altında ezildi. Ek olarak her şeyi tek bir otomatik model altında birleştirme fikri de pek sevilmedi. Gene de birçok mevzuda oldukca daha iyi bir model olduğunda çoğumuz hem fikiriz diye düşünüyorum.



