Yapay Zeka

Apple, “OpenELM” İsimli Yepyeni Dil Modelleri Yayımladı

Apple, OpenELM adını verdiği ufak dil modelleri yayımladı. Üretken yapay zekâ modelleri, “Apple, buluta ek olarak aygıt içi yapay zekâ özellikleri de sunacak” iddialarını güçlendiriyor.

Haziran ayında iPhone’lara getireceği yapay zeka özelliklerini açıklayacak olan Apple, bu mevzuda hamleler hayata geçirmeye devam ediyor. Apple’ın araştırmacıları, son aylarda birden fazla değişik türden yapay zekâ modelleri yayımlamıştı. Bunlara bir yenisi daha eklendi.

Araştırmacılar, “OpenELM” adını verdikleri dil modellerini Hugging Face Hub üstünden yayımladı. Bu modeller, üretken yapay zekânın cihazlarda iyi mi kullanılacağı mevzusunda bizlere düşünce veriyor.

Modeller, yapay zekânın bulut üstünden değil de direkt cihazdan çalışmasını sağlıyor

Açılımı “Açık Kaynaklı Verimli Dil Modelleri” olan bu modeller, e-posta yazma benzer biçimde metin odaklı görevlerde “oldukca verimli” olarak nitelendirilmişler. Ek olarak açık kaynaklılar ve herhangi bir geliştirici tarafınca kullanılabiliyorlar.

OpenELM modelleri, dört değişik boyuta sahipler ve hakikaten “ufak dil modeli” olarak sınıflandırılabilecek seviyedeler. Öyleki ki boyutları sırasıyla 270 milyon parametre, 450 milyon parametre, 1,1 milyar parametre ve 3 milyar parametre. Parametreler, modellerin karar verme aşamasında eğitim veri kümelerinden kaç değişkeni anlayabildiği gösteriyor.

Küçüklüğünü anlamanız için örnek verelim. Microsoft, geçtiğimiz günlerde “en ufak yapay zekâ modelim” söylediği Phi-3’ü tanıtmıştı. O modelin boyutu 3,8 milyar parametreydi. Apple’ınkiler ise 270 milyona kadar iniyor. Bu kadar ufak olmalarının anlamı ne peki? Daha azca maliyetli olmaları ve telefonlar, dizüstü bilgisayarlar benzer biçimde cihazlarda çalışacak şekilde optimize edilebilmeleri.

Doğrusu iPhone’larda yapay zekânın iyi mi çalışacağı hakkında ipucu sağlıyor bu modeller. Yerleşik olarak kullanılabilmeleri, bulut ihtiyacını ortadan kaldırıyor. Apple’ın aygıt içi yapay zekâ mevzusunda hamlelerini artırdığını görmüştük. Birkaç gün ilkin Bloomberg’den Mark Gurman, buluta ek olarak tamamen aygıt üstünde çalışan özellikler de geliştirdiğini belirtmişti. Bu modeller de bu iddiayı destek sunar özellikte.

İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu