DeepSeek’in sunulmasıyla yapay zekâ dünyasında kartlar tekrardan dağıtılmaya başladı. Ikimiz de ChatGPT (4o), DeepSeek ve Gemini’yi üniversite sınavına sokarak onlara küçük bir sınama yaptık.
Artık hayatımızın her alanında başvurduğumuz yapay zekâ araçları olmadan yapması imkansız olduk. Bu araçların gittikçe çeşitlenmesi, akıllara şu suali getiriyor: En fazlaca hangisine güvenmeliyiz?
Ikimiz de buradan yola çıkarak küçük bir sınama yapmak istedik. DeepSeek, ChatGPT ve Gemini’ye 2024 yılının TYT üniversite sorularından yönelttik. İşte sonuçlar…
Türkçe sorusuyla başlıyoruz.
Soru #1:
Yapay zekâ araçlarının cevapları:


**
**
İlk sorumuzda ChatGPT, imtihan rakiplerinden geride kalıyor. Cevabı D olması ihtiyaç duyulan soruya B olarak yanıt veriyor.
Haydi bir talih daha verip bir Türkçe sorusu daha soralım.
Soru #2:

Yapay zekâ araçlarının cevapları:

**
**

Bu soruda üç yapay zekâ aracımız da doğru cevaba ulaşıyor. Gemini, epey detaylı bir halde konu alıyor hatta.
Sırada Toplumsal Bilimler var. Bir tarih sorusuyla devam edelim.
Soru #3:

Yapay zekâ araçlarının cevapları:
**
**
**
**
**
**
Üçünün de tarih bilgisi iyiymiş çok açık ki. Doğru cevaba hepsi ulaştı. Gemini gene fazlaca detaylı bir izahat yapmış oldu.
Birazcık da coğrafya bilgilerini sınayalım.
Soru #4:

Yapay zekâ araçlarının cevapları:
**
**
**
**
**
**
Bu soruda elenen, Gemini oluyor. Sen o denli detaylı yaz yaz, sonrasında yanlış cevabı bul…
Eveeet, geldik matematiğe.
Soru #5:

Yapay zekâ araçlarının cevapları:
**
**
**
**

Devreler yandı. Gemini, “Hocam soru yanlış ya!” tribine girerken ChatGPT direkt yanlış yanıt verdi. Bu probleminin kazananı ise DeepSeek oldu.
Fen Bilimleri’nde ne yapacaklar bakalım?
Soru #6:

Yapay zekâ araçlarının cevapları:



Kimyada da tarih kadar iyilermiş. Doğru cevabı üç yapay zekâ aracı da buldu.
Son soruya geldik. Fizikte onları zorlamayı yapalım.
Soru #7:

Yapay zekâ araçlarının cevapları:
**
**


ÖSYM’nin yanıt anahtarına nazaran yapay zekâ araçlarının üçünün de cevabı yanlış. Yanıt anahtarında doğru cevap A şıkkı olarak yazıyor.
Sonuçlara gelecek olursak…
Üç yapay zekâ aracına toplamda 7 soru yönelttik. DeepSeek’in skoru 7 üstünden 6, ChatGPT’nin skoru 7 üstünden 4, Gemini’nin skoru 7 üstünden 4 oldu.
Galip DeepSeek benzer biçimde görünüyor sadece unutmamak gerekir ki bu sorular tamamen rastgele seçildi ve sayıları azca. Tüm üniversite imtihan sorularını yöneltseydik bambaşka sonuçlar elde edebilirdik.



