Alibaba’dan GPT-5 ve Gemini 2.5 Pro’ya Rakip Olan Suni Zekâ: Qwen3-Max

Alibaba, yeni suni zekâ modeli Qwen3-Max’i duyurdu. Girmiş olduğu performans testlerinde GPT-5, Gemini 2.5 Pro ve Claude Opus 4’ü köşeye sıkıştıran model, an itibarıyla ücretsiz bir şekilde yayımlanmış durumda. Peki Qwen3-Max neler sunuyor?
Çinli teknoloji devi Alibaba’dan dikkat çeken bir hamle geldi. Şirket, GPT-5, Gemini 2.5 Pro ve Claude Opus 4 ile direkt rekabet edecek yeni üretken suni zekâ modeli “Qwen3-Max”i duyurdu. 36 trilyon token üstüne eğitilen ve 1 trilyonun üstünde parametreye ev sahipliği meydana getiren Qwen3-Max, girmiş olduğu performans testlerinde verdiği yüksek puanlarla tüketicileri mest edecek benzer biçimde görünüyor.
Qwen3-Max’in öne çıkan özelliği yüksek performansı değil. Bu suni zekâ modeli, PAI-FlashMoE isminde bir strateji ile eğitildi. Bu da verimliliği artırdı. Firmanın açıklamasına gore yeni model, Qwen2.5-Max-Base’e kıyasla yüzde 30 daha verimli eğitildi. Ek olarak eğitim süresi de hızlanmış oldu. SanityCheck ve EasyCheckpoint isminde teknolojilerle kesinti süresini beşte birine düşüren Alibaba, tüm bu tarz şeyleri bir araya getirerek daha iyi mantık, daha doğru matematik, daha kuvvetli bilimsel akıl yürütme ve genel olarak daha güvenilir bir sistem oluşturdu.
Gelelim performans testlerine:
Alibaba’nın yeni suni zekâ modeli, üretken suni zekâların genel sıralamalarını ortaya koyan LMArena’nın 3. sırasına yerleşti. Şu demek oluyor ki Gemini 2.5 Pro ve Claude Opus 4’ten sonraki en iyi modeli konuşuyoruz. Programlama kategorisinde bir kontrol olan SWE-Bench Verified’a giren Qwen3-Max, 69,6 puanla DeepSeek V3.1’i geride bıraktı. Modellerin API’leri ve harici araçları ne kadar iyi kullanabildiğini ölçen Tau2-Bench testine de giren Qwen3-Max, 74,8 puan ile hem Claude Opus 4’ü hem de DeepSeek V3.1’i geride bıraktı.
Alibaba, Qwen3-Max’i Qwen’in resmî web sitesi üstünden ücretsiz bir şekilde yayımlamış durumda. Bu suni zekâya ulaşmak isteyen okurlarımız buradaki bağlantıyı kullanabilirler. Geliştiriciler ise Alibaba Cloud bünyesindeki Model Studio vesilesiyle bir API olarak Qwen3-Max’e erişim sağlayabilirler.




