Donanım

Apple’ın Yeni Suni Zekâ Dil Modeli Ortaya Çıktı: Rakiplerine Kıyasla 128 Kat Daha Süratli Metin Yazabiliyor!


Apple’ın uzun metinleri rakiplerine kıyasla ciddi oranda daha süratli yazabilen yeni suni zekâ dil modeli “FS-DFM” (Few-Step Discrete Flow-Matching) ortaya çıktı.

Apple, her ne kadar suni zekâ alanındaki yeniliklerde geç kalmasıyla eleştirilse de şirket uzun metinleri inanılmaz bir hızla yazabilen yeni bir dil modeli geliştirmiş durumda. “FS-DFM” (Few-Step Discrete Flow-Matching) adında olan bu model, rakiplerine nazaran tam 128 kat daha süratli metin üretebiliyor. Ohio State Üniversitesi ile ortak yürütülen çalışmada, model yalnızca sekiz adımda tam metinler oluşturabiliyor.

Apple’ın bu başarıyı elde etmesinin arkasında üç aşamalı hususi bir eğitim yöntemi bulunuyor. Model, her adımda “öğretmen” bir suni zekâdan rehberlik alarak metni daha doğru şekilde geliştiriyor. Ek olarak bu sistem, metin standardını ölçen “perpleksite” ve “entropi” skorlarında da dev modellere nazaran üstün performans sergilemiş durumda. An itibarıyla 7 ve 8 milyar parametreli rakiplerine rağmen, Apple’ın yalnızca 1,7 milyar parametreye haiz FS-DFM modeli hem daha naturel hem de daha tutarlı sonuçlar üretiyor.

Apple yakında bu dil modelini ürünlerinde kullanabilir

FS-DFM’nin başarısı yalnızca hız değil, hem de kalite ve verimlilik açısından da büyük ehemmiyet taşıyor. Daha azca kaynakla daha iyi sonuçlar alınması, bilhassa mobil cihazlarda suni zekâ tabanlı metin üretimini oldukca daha erişilebilir kılabilir. Hatta oldukca kısa sürede iPhone ve Mac’lerde anında yazı oluşturma yada daha akıllı asistan deneyimleri benzer biçimde özelliklerin önünün açıldığını görebiliriz.

Apple araştırmacıları, modelin kodlarını paylaşarak öteki bilim adamlarının da bu alanda ilerlemesini sağlamayı planlıyor. Şimdilik firmanın bu alanda resmî bir açıklaması yok fakat yakında daha çok detay duymamız olası.

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button