Facebook, Casual Conversations İsimli Veri Setini Yayınladı
Facebook, yapay zeka algoritmalarının ten rengi, yaş ve cinsiyetleri tespit etme ve değişik koşullarda aynı performansı sunabilme noktasında ne durumda olduklarının kontrol edilmesinde kullanılabilecek 10 TB’lık bir veri seti yayınladı. Bu veri seti, makine öğrenimi ve yapay zeka alanında çalışan araştırmacıların projelerini geliştirmelerine destek olacak.
Yapay zekaların kullanımı, artık günlük hayatımızın neredeyse her anına birlikte rol alır durumda. Kullandığımız telefonları, evlerimizi, baktığımız tüm ekranları giderek daha akıllı hale getiren yapay zeka, tesir alanının hızla artmasını her geçen gün gelişen yetkinliklerine borçlu. Yapay zeka algoritmaları geliştiren araştırmacıların en mühim problemlerinden biri ise bilhassa ses ve görüntü tanıma noktasında değişik koşullarda ve değişik insanlarda eşit derecede başarıya ulaşmış sonuçlar elde edebilme durumu.
Facebook da bugün, tam da bu mevzuda araştırmacılara destek olacak yeni bir veri seti yayınladı. Casual Conversations adı ile gösterilen 10 TB’lik veri setinde 3011 katılımcıdan alınmış toplamda 45 bin dakikalık videolar var. Değişik ten rengi, yaş ve cinsiyetten kişilerden, izinleri doğrultusunda anlaşmalı olarak toplanan bu veriler, yapay zeka algoritmalarının geliştirilmesi noktasında kullanılabilecek.
Veri setinin katılımcı çeşitliliğinin gelecekte artırılması hedefleniyor:
Veri setinin yayınlanmasının temel amacı, yapay zekanın her renkten, her yaştan ve her cinsiyetten insana eşit davranıp davranmadığını kontrol ederek bu aşamada gelişmesine destek olmak. Facebook AI Red Team‘in araştırma yöneticisi Cristian Canton, geliştiricilerin bu veri setinden tam olarak iyi mi yararlanacaklarını anlatmak için bir Facebook Portal örneği kullanmış. Facebook’un bilhassa görüntülü görüşmelerin standardını çoğaltmak için geliştirdiği ve sonrasında yeni özellikler ile kuvvetlendirdiği Portal, akıllı kamerası yardımıyla büyük kullanım kolaylıkları sunuyor.
Canton, örneğinde ise durumu şu şekilde özetliyor: “Portal cihazını düşünün. İçinde insanları izleyen bir kameramız var. Bugün bu teknolojiyi geliştiren mühendis olsaydım, kapsayıcı olduğundan güvenilir olmak için yayınladığımız bu veri kümesini alıp portaldaki seyretme algoritması vesilesiyle çalıştırabilir; nerede iyi performans göstermediğini ölçebilirdim. Mesela, belli bir yaş, renk yada cinsiyetteki bir şahıs için düşük ışıkta işe yaramadığını fark edebilirdim O vakit algoritmamın belirli bir alt grup için eksikliği bulunduğunu anlardım.”
Ekip bununla birlikte veri setinin çeşitliliğini çoğaltmak için gelecekte dünyanın değişik ülkelerinden kişileri içeren bir emek verme da yapmayı hedefliyor. Böylelikle yapay zeka algoritmalarının tüm insanoğlu için eşit seviyede performans sunabilmesi amaçlanıyor.



