Suni Zekânın Ürettiği Görselleri Şıp Diye Anlarken Müzikleri Niçin Ayırt Edemiyoruz?

Günümüzde suni zekâ ile üretilen görselleri idrak etmek mevzusunda birçoğumuz ustalaşıyor olsa da suni zekâ ile meydana getirilen müzikleri anlamakta gerçekte zorlanıyoruz. Peki bunun sebebi tam olarak ne?
Toplumsal medyada gezinirken karşımıza çıkan o ultra gerçekçi fakat bir o denli da garip görselleri düşünün… Geçmişte daha fena olsalar da günümüzde daha iyi seviyelere geldiler evet fakat hâlâ o yapaylık hissi duruyor ve gözlerimiz o filtreyi artık geliştirmiş durumda.
Mevzu müziğe vardığında ise işler aniden değişiyor ve dinlediğimiz o yeni, akılda kalıcı şarkının bir insan tarafınca mı yoksa gelişmiş bir algoritma tarafınca mı bestelendiğini idrak etmek neredeyse olanaksız durumda. Peki gözlerimiz bunu saniyeler içinde yakalarken kulaklarımız niçin bu kadar kolay kandırılıyor?
Görsel anormallik zihnimizde alarmlar çalıyor
Bu durumun en temel sebebi, beynimizin görsel ve işitsel verileri işleme biçimindeki devasa farktan kaynaklanıyor. İnsan beyni, milyonlarca senelik evrim süreci süresince yüzleri, vücut oranlarını ve fizyolojik dünyadaki ışık gölge oyunlarını tanıma mevzusunda inanılmaz bir uzmanlık geliştirdi. Karşımızdaki bir insanoğlunun yüzünde milimetrik bir orantısızlık olduğunda yada bir elin duruşu naturel fizik kurallarına aykırı göründüğünde, beynimizdeki alarm zilleri anında çalıyor.
“Uncanny Valley” doğrusu Türkçesi tam karşılığı olmasa da “Tefkinsiz Vadi” denilen bu fenomen yüzünden, gerçeğe fazlaca yaklaşan fakat tam olamayan görüntüler bizlere ürkütücü ve düzmece geliyor. Görsel dünyada referans noktamız somut gerçeklik olduğundan en küçük hatayı affetmiyoruz.
Suni zekâ işitsel hususları daha kolay kopyalıyor

Müzikte ise durum fazlaca daha soyut ve matematiksel bir zemine oturuyor. Müzik, doğası gereği belirli kalıpların, ritimlerin ve frekansların tekrarına dayalı bir sanat formu olduğundan suni zekânın bu kuralları öğrenip yansılamak etmesi görsel dünyaya kıyasla daha “pürüzsüz” sonuçlar veriyor.
Bir görselde altı parmaklı bir el görmek belirgin bir hatayken, müzikte alışılmadık bir ritim yada değişik bir tını duymak bir hata değil, “sanat içerikli bir tercih” yada yeni bir biçim olarak yorumlanıyor. Müziğin hatayı tolere etme kapasitesi görselliğe gore fazlaca daha yüksek olduğundan suni zekânın ürettiği besteleri yadırgamıyoruz.
Yanıt müziğin evriminde de gizli saklı

İşin bir öteki boyutu da kulaklarımızın aslına bakarsanız uzun senelerdir “suni” seslere aşina olmasıyla ilgili. Son otuz kırk senedir dinlediğimiz popüler müziklerin neredeyse tamamı synthesizer’lar, davul makineleri ve ağır stüdyo efektleriyle üretiliyor. Auto-tune şeklinde ses düzeltme teknolojileri yardımıyla insan sesinin bile ne kadarının naturel, ne kadarının dijital bulunduğunu ayırt edemediğimiz bir çağdayız.
Esasen elektronik ve dijital olarak üretilmiş seslere alışkın olduğumuz için suni zekânın ürettiği bir melodiyi duyduğumuzda bunu “suni” olarak etiketlemek yerine çağdaş bir prodüksiyon olarak kabul ediyoruz. Kısaca gözlerimiz doğallığı ararken, kulaklarımız bileşik mükemmelliğe çoktan alışmış durumda.
Teknik olarak da bir tutmamak gerek

Son olarak, görsel dünyadaki karmaşıklık ile ses dünyasındaki veri akışı arasındaki teknik farkı da unutmamak gerekiyor. Bir fotoğraf karesinde milyonlarca pikselin, ışığın, dokunun ve perspektifin birbiriyle tutarlı olması gerekirken, müzik zamana yayılan doğrusal bir frekans dizisi olarak işleniyor.
Suni zekâ, müzik teorisindeki matematiksel kuralları (hangi notanın hangisinden sonrasında geleceği şeklinde) görselliğin kaotik fizik kurallarına gore fazlaca daha kolay ve hatasız uygulayabiliyor. Bu yüzden bugün dinlediğiniz o mükemmel şarkının arkasında bir besteci değil, bir tek fazlaca iyi eğitilmiş bir algoritma olabilir ve kim bilir siz bunu muhtemelen hiçbir süre fark etmeyeceksiniz…



