Metinden Görüntü Üreten Yapay Zekâ 30 Kat Hızlanacak
Bilim adamları, metinden görüntü üreten yapay zekâ araçlarının hem hızlanmasını hem de daha doğru sonuçlar üretmesini elde eden bir teknoloji geliştirdiler. “DMD” isminde teknoloji, yapay zekânın değişik alanlarında da kullanılabilir.
Massachusetts Teknoloji Enstitüsü (MIT) bünyesinde çalışmalarını sürdüren bir grup bilim insanı, metinden görüntü üretmeye yarayan DALL-E 3 ve Stable Diffusion şeklinde yapay zekâ araçlarını 30 kata kadar hızlandırmaya yarayan yeni bir framework geliştirdiklerini duyurdular. Bu framework, kullananların mümkün olan en kısa sürede en iyi sonuca ulaşmalarını sağlayacak.
Hâlihazırda kullanılabilir durumda olan metinden görsel üretme araçları, genel anlamda tek seferde fazlaca iyi sonuçlar vermiyorlar. İşte MIT mühendislerinin geliştirdiği yeni framework, tam olarak bu noktaya parmak basıyor. Framework, görüntü üretme sürecini tek bir adımda basitleştirmeye ve daha süratli görüntü üretmeye odaklanıyor. Hem de bu görüntüler, HD kalitede oluyor.
Peki bu iyi mi mümkün oldu?
MIT mühendislerinin “DMD” olarak isimlendirdikleri framework, makine öğrenimi tekniklerinden olan “öğretmen-öğrenci“yi temel alıyor. Bu teknikte hâlihazırda eğitilmiş olan modeller, asıllarını yansılamak ederek yeni bir model hâline getiriliyorlar. MIT’den Tianwei Yin, bu yöntemle hem görsel kalitesinin artırıldığını hem de mevcut modelin 30 kata kadar hızlandırıldığını beyan etti. Böylelikle kullanıcının yeniden yeniden girdi işlemesine gerek kalmamış olacak.
DMD, görüntü üretmenin fazlaca daha ötesine geçebilir

MIT, DMD’yi metinlerden görsel üretmek için tasarladı ve başarı göstermiş sonuçlar elde etti. Sadece bu demek değil ki teknoloji, yalnız metinden görsel üretmek için kullanılacak. MIT mühendisleri, bunun tüm yapay zekâ araçlarına uyarlanabileceğine inanıyorlar. Eğer böyle bir durum gerçek olursa DMD, 3 boyutlu modelleme yada ilaç üretimi şeklinde yüksek hızın daha mühim olduğu alanlarda da kullanılabilir.
Sadece bunun o denli da kolay olmadığını izah edelim. Bundan dolayı MIT, DMD teknolojisini evvel eğitilmiş ağlar kullanarak ortaya çıkardılar. Kısaca aslına bakarsan mevcud teknolojiler, tekrardan işlendi. Bu sayede de süreç hızlanmış oldu. DMD’nin daha geniş kapsamlı projelerde kullanılmak istenilmesi, fazlaca daha büyük eğitim setlerine gerekseme duyulmasına yol açacaktır.



