Yapay Zeka

NVIDIA Fugatto Metinden Ses Oluşturan Yapay Zekâ Tanıtıldı

NVIDIA, metinle verilen komutlardan ses dosyası oluşturabilen yapay zekâ aracı Fugatto’yu tanıttı.

Hem donanımları hem de modelleri ile yapay zekâ alanının en mühim oyuncuları içinde yer edinen NVIDIA, “ses için İsviçre çakısı” olarak nitelendirdiği yeni deneysel üretken yapay zekâ modeli olan Fugatto’yu (Foundational Generative Audio Transformer Opus 1) tanıttı.

Fugatto, isim olarak lügatımızda füg dediğimiz oldukça sesli ve yine eden melodilerden oluşan besteleme modelinin adı Fugato’ya oldukça benziyor. Bu da boşuna değil, yapay zekâ modeli de “oldukça sesli” ve değişik aksanları ve değişik dilleri de algılayabilmesi için dünyanın dört bir yanından araştırmacılar tarafınca geliştirildi.

Sesleri insanların anladığı benzer biçimde anlayacak

Mevzuyla ilgili açıklamalarda bulunan NVIDIA Uygulamalı Ses Araştırmaları Yöneticisi Rafael Valle, “İnsanların sesleri anladığı ve ürettiği benzer biçimde anlayan bir model oluşturmak istedik.” ifadesini kullandı. NVIDIA, Fugatto’nun gerçek dünyadaki ihtimaller içinde kullanım senaryolarına da duyurusunda yer verdi. Bu senaryolar içinde bir şarkı fikrinin prototipini oluşturmak, değişik tarzlar, sesler ve enstrümanları tecrübe etmek yer aldı.

Kullanıcılar ek olarak bu modelle beraber değişik ses tonlarıyla ve aksanlarla dil öğrenebilecek, oyun geliştiricileri aynı sesin varyasyonlarını üretmek için modelden yardım alabilecekler. Ek olarak bu model, küçük ayarlarla daha ilkin eğitilmediği alanlarda da kullanılabiliyor.

Fugatto’nun kamunun erişimine açılıp açılmayacağı ise belirtilmedi. Daha ilkin Meta ve Google da benzer yapay zekâ modelleri geliştirmişti.

İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu