8 yaşındaki bir çocuğa kol saati gösterip “Saat kaç?” diye sorduğunuzda size rahatça yanıt verebilir. Peki ya en gelişmiş yapay zekâ modelleri? İşte burası ilginçleşiyor!
Yeni bir araştırma, günümüzün en kuvvetli yapay zekâ sistemlerinin bile analog saatleri okumakta zorlandığını ortaya koydu. Hatta bazıları bu rahat görevi tamamen yanlış yapıyor.
Peki niçin? Yapay zekâ niçin hâlâ oldukca rahat görevlerde bile geride kalıyor?
Yapay zekâ niçin saati okuyamıyor?

arXiv’da piyasaya çıkan araştırma; GPT-4, Claude 3 ve Gemini benzer biçimde dev dil modellerinin analog saatleri anlamakta niçin zorlandığını inceliyor. Sonuçlar oldukça çarpıcı:
- GPT-4, analog saat görüntülerini yorumlarken %50’ye yakın hata oranına haiz.
- Claude 3, bazı saatleri doğru okusa da akrep ve yelkovanın pozisyonlarını karıştırıyor.
- Gemini ise kimi zaman saati tamamen değişik bir halde yorumluyor (“10.10” yerine “2.50” diyebiliyor).
Peki bu kadar gelişmiş modeller niçin bu şekilde temel bir işlemi yapamıyor? Yanıt, yapay zekânın öğrenme şeklinde yatıyor.
Aslolan problem, yapay zekâ anlamıyor, yalnız tahmin ediyor.

Yapay zekâ modelleri, insan beyni benzer biçimde kavramları içselleştirerek öğrenmek yerine büyük veri setlerindeki kalıpları ezberliyor ve bu kalıplara dayanarak tahminler yapıyor.
Kısaca bir analog saati görünce “Bu, akrep ve yelkovanın açısal ilişkisidir.” diye düşünmüyor. Onun yerine, eğitim verilerinde görmüş olduğu benzer görsellerle eşleştirme halletmeye çalışıyor.
İşte problem da burada başlıyor. Eğitim verilerinde analog saatler yeterine çeşitli değilse model yanlış öğreniyor. Saat okuma, görsel-mantıksal bir bütünlük gerektiriyor. Yapay zekâ ise görseli parçalara ayırıp ilişkilendirmekte zorlanabiliyor.
Ek olarak Romen sayıları, rakamsız saatler vb. değişik stillerdeki saatler de kafasını karıştırıyor.
Peki bu, yapay zekânın sınırı olan olduğu anlamına mı geliyor?

Tam olarak değil. Bu durum, yapay zekânın “genel akıl yürütme” (common sense reasoning) mevzusunda hâlâ eksikleri bulunduğunu gösteriyor.
İnsanlar için son aşama rahat olan bu vazife, yapay zekâ için karmaşık bir bulmaca benzer biçimde sadece bu, gelecekte düzeltilemeyecek bir problem değil. Sonuçta daha ilk çıktığında bir elin parmaklarını bile muntazam çizemiyordu, şimdilerde ise gerçeğinden ayırt etmek zor.
Araştırmacılar, modellerin “çoklu modalite” (multimodal) öğrenme kabiliyetlerini geliştirerek bu problemi aşmayı hedefliyor. Kısaca yapay zekâ yalnız metin yada yalnız görsel değil, ikisini bir arada daha iyi işleyebilirse analog saat okuma benzer biçimde görevlerde de başarı göstermiş olabilir.
Netice: Yapay zekâ hâlâ öğreniyor!

Bu araştırma bizlere şunu gösteriyor: Yapay zekâ inanılmaz kabiliyetlere haiz olsa da insanların naturel olarak yapmış olduğu bazı temel işlemlerde hâlâ zorlanabiliyor.
Peki sizce yapay zekâ bigün bu tür rahat görevleri kusursuz yapabilecek mi yoksa bazı şeyler yalnız insana mı özgü duracak? Düşüncelerinizi yorumlarda paylaşın!
Bonus: Eğer bir yapay zekâ modeline “Saat kaç?” diye sormak isterseniz ilkin ona bir dijital saat gösterin. Muhtemelen daha doğru yanıt alırsınız!



