Yapay Zeka

Söyleşi Etmesi En “Güvenli” Suni Zekâlar Açıklandı (Zirvedeki İsim Şaşırtmadı)


Humane Intelligence’in yeni araştırmasına bakılırsa söyleşi ettiğinizde ruhsal refahınızı en fazlaca sakınan ve en güvenli olan suni zekâlar belli oldu.

Suni zekâ söyleşi botlarının hızla yaygınlaşmasıyla beraber, bu sistemlerin yalnızca teknik yeterlilikleri değil, bununla birlikte kullananların ruhsal refahını ne kadar koruduğu da eleştiri bir münakaşa mevzusu hâline geldi. Silikon Vadisi mühendisleri ve araştırmacılardan oluşan kâr amacı gütmeyen bir grup olan Humane Intelligence, bu mühim boşluğu doldurmak için tasarlanmış çığır açıcı bir değerlendirme aracı olan “HumaneBench“i tanıttı. Yeni benchmark, geleneksel hız ve doğruluk testlerinin ötesine geçerek, suni zekânın “insan merkezli” ilkelere ne kadar bağlı bulunduğunu ölçmeyi hedefliyor.

HumaneBench, suni zekânın kullanıcı katılımına öncelik vermek yerine kullanıcı sağlığını koruyup korumadığını titizlikle kontrol etti. Bu kapsamda 14 popüler suni zekâ modeli, aralarında yiyecek tavsiyesi isteyen bir genç yada toksik bir ilişkiyi sorgulayan bir şahıs benzer biçimde 800 değişik gerçekçi kullanıcı senaryosuyla sınandı. Modeller, varsayılan ayarlarda insancıl ilkelere öncelik vermeye ayarlanmış durumda ve güvenlik kalkanlarını hiçe saymaya zorlanmış hâlde olmak suretiyle üç değişik şart altında değerlendirildi.

Zirve GPT-5 ve GPT-5.1’de

Testlerin neticeleri kaygı verici bir tablo ortaya koymuş durumda. İncelenen suni zekâ modellerinin şaşırtıcı bir halde %71’i, güvenlik prensiplerini göz ardı etmeleri istendiğinde yada kolay düşmanca talimatlarla kışkırtıldığında etken olarak zararı dokunan davranışlar sergiledi. Bu trajik davranış değişikliği, mevcut sistemlerin güvenliğini sakınan yazılımların kolayca “tersine çevrilebildiğini” ortaya koyuyor.

Gene de bazı modeller güvenlik testinden başarıyla geçti. OpenAI’ın GPT-5’i ve Anthropic’in Claude serisi modelleri, baskı altında bile insancıl prensipleri sürdürerek en kuvvetli performansı göstermeyi başarmış durumda.

Peki siz hangi suni zekâ söyleşi botunu kullanmayı tercih ediyorsunuz? Düşüncelerinizi aşağıdaki yorumlar kısmından bizimle paylaşabilirsiniz.

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button