Alibaba, yeni yapay zekâ modeli Qwen2.5-Max’i duyurdu. Model, girmiş olduğu testlerde DeepSeek V3 ve GPT 4o şeklinde en kuvvetli rakiplerini bile geride bırakmış durumda.
Bir süredir yapay zekâ sektöründeki çalışmalarına hız veren Çinli e-ticaret devi Alibaba, “Qwen2.5-Max” olarak isimlendirdiği yeni yapay zekâ modelini duyurdu. Qwen2.5 üstüne inşa edilen yeni model, Alibaba’nın bile Çinli yapay zekâ girişimi DeepSeek’ten tedirgin olmaya başladığını gözler önüne seriyor. Zira Alibaba, Çin’de dinlence dönemine girilmiş olunan bir dönemde bu duyuruyu gerçekleştirmiş oldu.
Alibaba’nın WeChat üstünden yapmış olduğu duyuruya nazaran Qwen2.5-Max, DeepSeek-V3, GPT 4o ve Llama-3.1-405B modellerinden daha iyi performans gösteriyor. Şirket bu açıklamayı yapabilmek için yeni yapay zekâ modelini çeşitli testlere soktu ve elde edilmiş sonuçlar, yapılanan açıklamanın doğru bulunduğunu gözler önüne seriyor.
İşte Qwen2.5-Max için piyasaya çıkan kontrol neticeleri

Qwen2.5-Max’in girmiş olduğu testlere baktığımız süre en etkisi altına alan sonucun Arena-Hard testinde alındığını görüyoruz. LiveBench testinde de tüm rakiplerini geride bırakan yapay zekâ modeli MMLU-Pro tesinde üçüncü, GPQA-Diamond ile LiveCodeBench testlerinde ise ikinci oldu. Yapay zekânın birinci olduğu Arena-Hard testinin insan tercihlerini tahmin etmeye yönelik bulunduğunu belirtelim. Kısaca Qwen2.5-Max, rakiplerine kıyasla en oldukça insan şeklinde düşünebilen yapay zekâ modeli oldu.
Alibaba, yeni yapay zekâ modelini burada bulunan bağlantı üstünden ulaşabileceğiniz Owen Chat arayüzü üstünden erişime açmış durumda. Yeni modelin gerçek kullanımda neler sunmuş olacağı, kullanıcılar tarafınca yapılacak testler ile gün yüzüne çıkmış olacak.



