Yapay Zeka

Tüm Bilgisayarlarda Çalışabilen Türkçe Suni Zekâ Duyuruldu: Kumru!


Yerli yazılım şirketi VNGRS, Türkçe büyük dil modeli Kumru’yu duyurdu. Hemen hemen erken aşamada olan suni zekâ, haiz olduğu kabiliyetlerle dikkat çekmeyi başaracak şeklinde görünüyor. İşte Kumru’yla ilgili bilmenizde fayda olan her şey!

Yazılım, bulut ve suni zekâ sektöründe 15 senedir çalışmalarını sürdüren yerli girişim VNGRS’den dikkat çeken bir hamle geldi. Şirket, 7,4 milyar parametre üstüne eğitilen Türkçe büyük suni zekâ dil modeli “Kumru”yu duyurdu. Dikkat çeken özelliklerle donatılan suni zekâ, firmanın iddiasına nazaran oldukça iyi iş çıkarıyor. Gelin hep beraber Kumru’nun özelliklerine yakından bakalım.

45 günlük ön eğitim aşamasında NVIDIA’nın H100 ve H200 GPU’ları üstünde 500 GB büyüklüğünde veri ile eğitilen Kumru, Mistral-v0.3 üstüne inşa edildi. Ek olarak bu suni zekânın geliştirilmesi için Meta’nın LLaMA-3 modelinden de destek alındı. Ön eğitim aşamasının sonunda 300 milyar token’le haşır neşir olan suni zekâ, sonraki aşamada ise 1 milyon örnekle ince ayar işlemine sokuldu. Böylelikle Kumru’nun mümkün olan en iyi performansı vermesi sağlanmış oldu.

Bayağı bilgisayarlarda bile mahalli olarak çalışabiliyor!

Kumru’nun en dikkat çeken özelliklerinden bir tanesi, yalnız 16 GB VRAM kapasitesine haiz olan GPU’lar üstünde mahalli olarak çalışabiliyor olması. Bu oldukca mühim bu sebeple kurumsal müşteriler, bu suni zekâyı şirket içi bilgisayarlarda oldukca ucuza çalıştırabilecekler. Gelin bunu şu şekilde örnekleyelim:

LLaMA-3.3’ün 70 milyar parametreli versiyonunu yerleşik olarak çalıştırmak istediğinizde 140 GB VRAM kapasitesine gerekseme duyarsınız. Bu da 2 tane NVIDIA H100 gücüne denk gelir ve 60 bin dolar seviyesinde bir maliyet ile karşı karşıya gelirsiniz. Kumru’yu mahalli olarak çalıştırmak isterseniz RTX A4000 yada RTX 3090 şeklinde bir GPU işinizi görecektir. Bu da kabaca 2.000 dolar maliyet demek.

**Kumru ile öteki büyük dil modellerinin maliyet farklılıklarını gösteren tablo:
**

Başlıksız-1

Burada öteki dil modellerinin oldukca daha gelişmiş bir yapıya haiz bulunduğunu söyleyebiliriz, maliyet durumunu eleştirebilirsiniz. Sadece şu şekilde bir detay var; minik bir işletme olduğunuzu düşünün. 7,4 milyar parametre, pek oldukca işlem için oldukça kafi seviyede olacaktır.

Gelelim Kumru’nun kabiliyetlerine ve performans testi sonuçlarına:

Kumru, aslen tıpkı ChatGPT şeklinde metin odaklı bir suni zekâ. Kısaca bu suni zekâyı kullanarak herhangi bir araştırma yapabilir, içerik yetiştirebilirsiniz. VNGRS tarafınca meydana getirilen açıklamaya nazaran ise Kumru, daha oldukca belge işleme, özetleme ve soru-cevap şeklinde işlemlerde daha iyi sonuçlar veriyor. İngilizce de bilen suni zekânın kodlama yapabildiğini de belirtmeden geçmeyelim. VNGRS, Kumru’nun 8.192 Türkçe token desteklediğini, bunun da A4 üstüne yazılmış 20 sayfalık belge anlamına geldiğini söylüyor.

Başlıksız-1

Kumru, Türkçe odaklı büyük dil modelleri için bir performans testi olan Cetvel’e sokuldu. Dil bilgisi hatası düzeltme, belge özetleme, sual cevaplama, makine çevirisi, organik dil çıkarımı ve metin sınıflandırması şeklinde 26 değişik kategoride kontrol edilen suni zekâ, averaj sonuçlarda rakiplerini geride bırakmış durumda. Kumru’nun hemen hemen erken aşamadayken bile bu kadar iyi netice veriyor olması hakikaten dikkat çekici.

Eğer siz de Kumru’nun neler sunduğunu görmek isterseniz, buradaki bağlantı üstünden suni zekâya ulaşabilirsiniz. Ayrıca; Kumru’nun “Kumru-2B” isminde daha minik bir versiyonunun da Huggingface üstünden yayımlandığını belirtelim. 2B versiyon, Kumru-7B isminde temel versiyon ile aynı eğitim sürecinden geçti sadece daha hafifçe bir model. Hatta yalnız 4,8 GB hafıza ihtiyacı duyan Kumru-2B, bu özelliği yardımıyla mobil cihazlarda bile çalışabiliyor. Kumru-2B’ye ulaşmak için de buraya tıklayabilirsiniz.

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button