Donanım

OpenAI, Metinden Video Oluşturan Modeli “Sora”yı Tanıttı

OpenAI, bugün “Sora” adını verdiği metinden video oluşturma aracını tanıttı. Şimdilik güvenlik uzmanları tarafınca kontrol edilen model, ürkütücü derecede gerçekçi 60 saniyelik videolar oluşturabiliyor.

ChatGPT’nin geliştiricisi OpenAI, bugün dünyayı kasıp kavuran yapay zekâ modellerine bir yenisini daha ekledi. “Sora” adı verilen model, metinden video oluşturabiliyor. Firmanın paylaşmış olduğu örnek görüntüler ise modelin ürkütücü derecede iyi bulunduğunu gösteriyor.

Sora, şu anda dezenformasyon, nefret içerikleri ve ön yargı benzer biçimde mevzularda uzman olan kişiler tarafınca kontrol ediyor. Şirket, modeli kullanıma sunmadan ilkin lüzumlu güvenlik adımlarını atmak istediğini ifade ediyor.

Sora, metin komutlarıyla 60 saniyelik gerçekçi videolar oluşturabiliyor

Güzel, karlı ve hareketli Tokyo şehri. Kamera, güzel karlı havanın tadını çıkaran ve yakındaki tezgahlarda alışveriş yapan birkaç kişiyi takip ederek şehrin hareketli caddesinde ilerliyor. Muhteşem sakura yaprakları kar taneleriyle birlikte rüzgarda uçuyor.”

*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.

Başta da belirttiğimiz benzer biçimde Sora bir metinden video oluşturma modeli. Şu demek oluyor ki yazdığınız bir metin komutunu videoya çevirebiliyor. OpenAI, Sora’nın 60 saniye, şu demek oluyor ki bir dakikaya kadar video oluşturabildiğini açıkladı.

Bu videoların görsel kalitesinin yüksek kalabildiği, son aşama detaylı olduğu, karmaşık hareketleri ihtiva ettiği ve canlu duygulara haiz birden fazla karaktere yer verebildiği ifade edildi. Esasen videolara baktığımızda ürkütücü derecede gerçekçi bulunduğunu görebiliyoruz. OpenAI’ın yapmış olduğu izahat şu şekilde:

Sora, birden fazla karakterin, belirli hareketlerin, mevzunun ve arka planın doğru ayrıntılarının yer almış olduğu karmaşık görüntüler oluşturabiliyor. Model, yalnızca kullanıcının komutta ne istediğini değil, bununla birlikte bu şeylerin fizyolojik dünyada iyi mi var bulunduğunu da anlıyor.”
Sora, güvenlik için kontrol edenlerin yanı sıra sanatçılar, sinemacılar ve tasarımcılar benzer biçimde kişilere de açılacak. Bu kişiler, yapay zekâ aracını kullanarak geri bildirim sağlayacaklar ve modelin daha gelişmiş hâle gelmesine katkıda bulunacaklar.

Görsellerden de video üretebiliyor

*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.

Bunun haricinde OpenAI, bir tek metinden değil, görsellerden de video oluşturabildiğini ekledi. Firmanın Açıklamasına bakılırsa hâlihazırdaki bir görseli alıp ondan video üretebiliyor. Bu videoda da minik detaylara ve ayrıntılara dikkat ediyor.

Bazı zayıf yönleri de yok değil

Doğal ki model hemen hemen kontrol aşamalarında olduğundan zayıf yönleri de var. OpenAI da bunu kabul ediyor. Şirket, kimi zaman karmaşık sahnelerin fiziğini doğru bir halde simüle etmekte zorlanabileceğini ve neden-sonuç örneklerini anlayamayabileceğini söylüyor.

Sözgelişi oluşturulan bir videoda bir kişinin kurabiye ısırdığını sadece sonrasında bu kurabiyede herhangi bir ısırık izi kalmadığını görebiliriz. Ek olarak sol ve sağ benzer biçimde bilgileri karıştırabileceğini ve kameranın gidişini izlemek benzer biçimde süre içinde meydana gelebilecek vakaları açıklamada zorlanabileceği söyleniyor. Yukarıdan bu hatalardan örnekleri görebilirsiniz.

Gene de genel olarak örnek videolara baktığımızda Sora’nın ne büyük bir potansiyele haiz bulunduğunu görebiliyoruz. Yapay zekâ modelleri mevzusunda çığır açma potansiyeline haiz olduğu aşikar. Her insana vardığında neler yapabildiğini göreceğiz.

Sora ile üretilen öteki video örnekleri

*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.

*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.



İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu