Donanım

Google, Yapay Zeka ile Üretilen Videoları Yapay Zeka ile Seslendirecek

Google’ın yapay zeka birimi DeepMind, yapay zeka tarafınca üretilen videoları seslendirecek yapay zeka aracını duyurdu. Sadece sonuçlar şimdilik fazlaca iyi değil…

Google’ın yapay zeka araştırma laboratuvarı DeepMind, V2A (“videodan ses” ifadesinin kısaltması) isminde yapay zeka tarafınca oluşturulan videoları seslendiren yeni aracını duyurdu. DeepMind’ın açıklamasına bakılırsa V2A, sesleri oluştururken hem yazılan açıklamadan yararlanıyor hem de videoyu px px çözümleme ediyor. Bu sayede izahat yazmasanız bile ses oluşturabiliyor.

Videoyu seslendirme üstüne yapay zeka araçlarının mühim bulunduğunu söylemek gerek. Zira günümüzde metinden ya da resimden video oluşturabilen pek fazlaca yapay zeka aracı olsa da bu araçlar çoğunlukla sessiz videolar üretebiliyor. Sadece tamamımız biliyoruz ki video, görsel olmasıyla birlikte işitsel de bir medya türüdür. Hızla ilerleyen bir tren videosu gördüğümüzde rayların, vagonların ve lokomotifin sesini duyamadığımızda video tesirini yitirmiş oluyor.

V2A’nın yapay zeka tarafınca üretilen bir gitar çalma videosunu seslendirdiği örnek

DeepMind, V2A’nın görüntüye uyumlu ses üretme ve sesi otomatikman görüntü ile senkronize etme açısından rakipsiz bulunduğunu öne sürüyor. Sadece paylaşılan örneklere baktığımızda etkilendiğimizi söylemek zor. V2A, görüntüye uygun ses üretiyor sadece daha fazlaca görüntüye uyumlu yığın bir sesi dublajlıyor şeklinde görünüyor.

Derhal aşağıdaki örnekler, V2A’nın videoları seslendirme mevzusunda hemen hemen ne kadar ilkel kaldığını anlamanızı sağlayabilir. Gene de bir zamanlar Dall-E’nin de bir zamanlar kanarya çiz denildiğinde tüylü bir sarı top çizdiğini unutmamak gerek. Yapay zeka araçları, kullandıkça gelişiyor…

İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu