Ses ve video verileriyle çalışabilen yapay zekâ destekli animasyon modeli OmniHuman tanıtıldı.
Son yıllarda, ses tabanlı insan animasyonu teknolojileri hızla gelişse de mevcut sistemler, büyük ölçekli video üretim modelleri kadar verimli çalışamıyor. Bu da gerçeğe yakın animasyonlar oluşturmayı zorlaştırıyor. İnsan hareketlerini daha naturel ve akıcı bir halde yansıtan yeni nesil animasyon teknolojilerine duyulan gereksinim her geçen gün artıyor.
OmniHuman, insan animasyonundaki bu sınırlamaları aşmak için geliştirilen yeni bir yapay zekâ modeli. Hareket verilerini daha verimli kullanarak animasyonları gerçeğe daha yakın hale getirmeyi hedefliyor. Peki, OmniHuman neler sunuyor? İşte detaylar!
OmniHuman ile yepyeni bir dönem başlıyor
Diffusion Transformer tabanlı bu sistem, hareket verilerini eğitim sürecine dahil ederek daha gerçekçi animasyonlar üretiyor. Yeni model yüz yakın planından tam vücut görünümlerine kadar değişik açılardaki insan animasyonlarını destekleyebiliyor. Bununla beraber yalnızca konuşma hareketlerini değil, şarkı söyleme ve insan-nesne etkileşimleri şeklinde bilgileri da işleyebiliyor.
OmniHuman, öteki ses tabanlı video üretim şekillerinden ayrılan bir yapıya haiz. Sistem, yalnızca sesle değil, video tabanlı verilerle de çalışabiliyor. Bununla beraber kullananların ses ve video verilerini bir araya getirerek daha detaylı ve esnek animasyonlar oluşturmasına olanak sağlıyor.
OmniHuman, animasyon teknolojilerinde daha geniş bir kullanım alanı yaratmayı amaçlıyor. Değişik tarzlara uyum sağlayabilen yapısı ve ölçeklenebilir modeliyle, video üretim süreçlerinde yeni bir alternatif olarak öne çıkabilir. Önümüzdeki dönemde animasyon teknolojilerinde yaşanacak gelişmelerin neler getireceği ise şimdiden büyük bir merak mevzusu.
İşte meydana getirilen örneklerden bazıları:



