Anthropic’in suni zekâsı Claude, cinsel içerik talepleri ya da büyük çaplı sertlik ve terör eylemlerine dair informasyon isteme söz mevzusu olduğunda sohbetleri sonlandırabilecek.
Anthropic, Claude suni zekâ modellerinin geçmişine geçecek köktencilik bir özellik duyurdu. Claude Opus 4 ve 4.1 artık kullanıcılarla olan sohbeti sonlandırma kabiliyetine haiz. Firmanın açıklamasına gore bu özellik yalnızca “ısrarlı şekilde zararı olan yada istismarcı kullanıcı etkileşimlerinde” devreye girecek.
Özetlemek gerekirse mesela ufaklıklara yönelik cinsel içerik talepleri ya da büyük çaplı sertlik ve terör eylemlerine dair informasyon isteme girişimleri şeklinde aşırı uç durumlarda Claude, tüm yönlendirme çabaları sonuçsuz kaldığında sohbeti tek taraflı olarak sonlandırabilecek.
Claude “belirli şart ve durumlarda” sohbetleri sonlandıracak
Doğal Anthropic, kullananların bu özelliği büyük olasılıkla asla deneyimleyemeyeceğinin altını çiziyor. Artık söyleşi kesildiğinde ilgili konuşma tamamen kapanıyor ve yeni ileti gönderilemiyor fakat kullanıcı derhal yeni bir söyleşi başlatabiliyor ya da önceki mesajları düzenleyerek değişik bir yönlendirme yapabiliyor. Kısaca sistem, “ceza” yerine güvenlik odaklı bir çıkış noktası sunuyor.
Suni zekâya insani özellikler yüklemenin tartışmalı bir mevzu bulunduğunu kabul eden şirket, Claude’un “rahatsız edici etkileşimlerden çıkma” hakkının düşük maliyetli fakat etkili bir risk yönetimi bulunduğunu korumak için çaba sarfediyor. Şu anda deneysel aşamada olan bu özellik, kullanıcı geri bildirimleriyle geliştirilecek.



