Meta, kendi dil modelinin peşinden bu kez ses klonlayabilen ve kaydedilen sesin düzenlenmesini elde eden yeni yapay zekâsı Voicebox’ı duyurdu.
Yapay zekâ teknolojilerinin gelişimiyle kendimizin yada bir başkasının sesini klonlayabilir, bu sesle cümleler söyletebilir olmuştuk. ElevenLabs ve Uberduck şeklinde platformlar bu mevzuda zirvede bulunurken bugün Meta’dan sürpriz bir hamle geldi.
Meta, yapay zekâ ile konuşmalar üretmenizi elde eden yeni “Voicebox” yapay zekâsını duyurdu. Voicebox, tıpkı azca ilkin bahsettiklerimiz şeklinde sesinizi klonlamanızı, bu ses ile yazdığınız metni seslendirmenizi sağlıyor. Normal olarak aslolan vaka, metnin seslendirilmesinin tıpkı bir insan şeklinde yapılmasında yatıyor.
Karşınızda Meta’nın ses teknolojisi Voicebox:
https://www.youtube.com/watch?v=5Mnc20YfT7k
- Voicebox ile konuşma seçimi klonlama.
Meta’nın “konuşmada üretken yapay zekâlar için çığır açan buluş” olarak paylaşmış olduğu Voicebox, yalnız ses yansılamak etme ve yazılanı okumak şeklinde fonksiyonlara haiz olmayacak. Yapay zekâ, bundan değişik dillerde konuşmanızı sağlamak dahil oldukça daha fazlasını meydana getirecek:
“Voicebox, sesin içeriğini ve stilini korurken yüksek kaliteli ses klipleri üretebilir ve otomobil kornalarını yada köpek havlamasını kaldırmak şeklinde öncesinden kaydedilmiş sesleri düzenleyebilir. Model bununla beraber oldukça dillidir ve altı dilde konuşma üretebilir.”
Voicebox, sizin sesinizi alarak, İngilizce, Fransızca, Almanca, İspanyolca, Polonyaca yada Portekizce olarak bir içinde ne olduğu seslendirebilecek.
Üstelik değişik dillerde seslendirme için o dilde yazı yada ses sunmanız gerekmeyecek. Yapay zekâ, Fransızca bir sesi yada metni İngilizce yada öteki tüm desteklenen dillere çevirebilecek.
Yalnız 2 saniyede ses klonlanabilecek:
Günümüz ses klonlama platformları, klonlama işlemi için minimum 5 dakikalık kayıtlar isterken Meta burada hakkaten çığır açmayı başardı. Şirket, Voicebox’ın yalnız 2 saniyelik bir kayıtla ses stilini öğrenebildiğini ve bu stili seslendirmeye aktarabildiğini açıkladı.
https://www.youtube.com/watch?v=gFeBV8mPwtA
- Ses düzenleme emek vermesi.
Tüm bunların yanı sıra ses kaydı alırken fark etmeden yanlış söyleniş ettiğiniz kelimeler, Voicebox ile yapay zekâ vasıtasıyla sonradan düzenlenebilecek.
Şirket, Voicebox ile alakalı araştırma makalesini yayınladı. Ek olarak kullananların yapay zekânın ilk seslerini duyabilecekleri demo sayfasını da yayınladı. Sadece yapay zekâ, kötüye kullanım ihtimalleri sebebiyle hemen hemen kullanıma sunulmadı. Şimdilik yalnızca bilimsel çalışmalara açık olacak.

