Çinli yapay zekâ devi DeepSeek, 2026 yılına mHC adını verdiği yeni bir teknik yazı ile girdi. Kurucu Liang Wenfeng imzalı emek verme, devasa modelleri oldukca daha düşük maliyet ve yüksek verimlilikle eğitmeyi vadeden “Manifold-Constrained Hyper-Connections” mimarisini tüm dünyaya duyurdu.
Yapay zekâ dünyası 2026’ya oldukça süratli bir giriş yapmış oldu. Çinli yapay zekâ devi DeepSeek, yayımladığı yeni teknik yazı ile temel yapay zekâ modellerinin eğitiminde kullanılan mimariyi kökten değiştireceğini ileri sürdü. Firmanın kurucusu Liang Wenfeng’in de aralarında bulunmuş olduğu 19 kişilik ekip, modelleri daha uygun maliyetli hâle getirmeyi amaçlıyor.
Bu yeni yöntem, bilhassa kısıtlı işlem gücüyle ABD’li rakiplerine karşı yarışan firmalar için can suyu durumunda olabilir. “Manifold-Constrained Hyper-Connections” (mHC) olarak adlandırılan teknik, modellerin ölçeklenebilirliğini artırırken hesaplama yükünü neredeyse asla artırmıyor.
Manifold-Constrained Hyper-Connections (mHC) nedir ve neyi değiştiriyor?
DeepSeek’in önerilmiş olduğu mHC mimarisi, aslına bakarsak ByteDance tarafınca 2024’te tavsiye edilen Hyper-Connections (HC) çözümünün geliştirilmiş bir versiyonu. Araştırmacılar; bu tekniği 3 milyar, 9 milyar ve 27 milyar parametreli modellerde kontrol ederek sistemin başarısını kanıtladı. Sonuçlar, mHC’nin geleneksel yöntemlere gore oldukca daha kesin bir büyük ölçekli eğitim sunduğunu gösteriyor.
Mevcut sistemlerde kullanılan ResNet mimarisi, derin ağlarda informasyon akışını stabilize etse de bazı sinyal sorunları yaşatabiliyordu . mHC ise bu süreci belirli bir “manifold” ile kısıtlayarak hafıza maliyetlerini denetim altında tutuyor ve verimliliği maksimize ediyor. Bu durum, gelecek nesil temel modellerin evrimi için yeni bir yol aydınlatabilir.

DeepSeek’in bu teknik makaleyi bizzat CEO Liang Wenfeng vasıtasıyla arXiv’e yüklemesi, sektör analistleri tarafınca mühim bir sinyal olarak görülüyor. Çoğu zaman bu biçim derin teknik paylaşımlar, firmanın bir sonraki büyük modelinin ayak sesleri olarak kabul ediliyor.
Şirket, geçtiğimiz yıl çığır açan R1 modelini Çin’in ulusal tatili arifesinde yayımlamıştı. Bu yıl da benzer bir stratejiyle, Şubat ortasındaki “Bahar Festivali” döneminde yeni bir modelin piyasaya sürülmesi planlanıyor. Yapay zekâ eğitiminde maliyetlerin bu denli düşmesi, sektördeki dengeleri tamamen değiştirebilir.

