Mozilla, 180 Dilde Yapay Zekâ Eğitim Verisi Sundu
Mozilla, “Common Voice” projesi kapsamında 180 dilde, toplam 30 bin saatlik veriyi kullanıma açtı.
Mozilla, 2017 senesinde “Common Voice” adını verdiği bir proje başlatmıştı. Bu proje kapsamında dünyanın dört bir yanından gönüllülerin ses kayıtları toplanmıştı. Projenin amacı ise küresel olarak kullanılabilecek, ses tanıma yapay zekâ araçlarının eğitilmesini sağlayacak eğitim setleri oluşturmaktı. Proje kapsamında bugüne dek 180 dilde 30 bin saatlik konuşma verisi toplanmıştı.
Mozilla bu veriyi kimin kullandığına dair oldukça fazla bilgiye haiz değil, aslına bakarsanız ses dosyaları da kamuya açık kaynak konumunda bulunuyor. Öte taraftan firmadan gelen açıklamalara gore bu verileri kullananlar içinde büyük teknoloji firmaları, minik bağımsız geliştiriciler ve değişik projelerde çalışan takımlar yer ediniyor.
Her yerde Mozilla’nın toplamış olduğu sesler kullanılıyor
Mozilla’nın Common Voice projesinde toplamış olduğu örnekler her projede aynı oranda kullanılmıyor. Mesela değişik dillerde hukuki danışmanlık veren modeller ya da satın alan temsilcisi söyleşi botları için veri setinin daha minik parçaları tercih ediliyor. Veri setinin şimdiye kadar milyonlarca kere inmiş olduğu belirtiliyor.
Common Voice, değişik kültürlerden ve bölgelerden iştirakçilerin da dahil olmasıyla beraber büyümeye de devam ediyor. Projeye yapay zekânın gelişmesini isteyen teknoloji meraklıları haricinde, kendi dillerinin ya da kültürlerinin de korunmasını isteyen gruplar büyük ilgi gösteriyor. Mesela kaybolmaya yüz tutmuş dillerden olan Gallerce’nin kayıtlarının tutulması için bu proje Galler tarafınca da teşvik ediliyor.
Mozilla ek olarak Afrika dilleri için de bir proje geliştiriyor.



