Çin'in Alibaba'sı yeni Qwen 3 AI modelleriyle Meta'yı geride bıraktı

Özet:

Çinli teknoloji devi Alibaba, açık kaynaklı Qwen 3 AI modellerinden oluşan bir aileyi piyasaya sürdü. Koleksiyonda 8 yeni model yer alıyor.
Öncü model olan Qwen3-235B-A22B MoE, 235 milyar parametre üzerinden eğitildi ve 22 milyar parametre etkinleştirildi.
Sadece 3 milyar aktif parametresi bulunan daha küçük model Qwen30-3B-A3B MoE, GPT-4o'yu büyük bir farkla geride bırakıyor.

Çinli teknoloji devi Alibaba, Qwen 3 serisinde sekiz yeni açık kaynaklı yapay zeka (AI) modelini piyasaya sürdü. Yeni Qwen 3 modelleri arasında Qwen3-235B-A22B ve Qwen3-30B-A3B olmak üzere iki adet MoE (Uzman Karışımı) modeli yer alıyor. Qwen3-235B-A22B, toplam 235 milyar parametre ve 22 milyar aktif parametre ile en büyük ve lider modeldir.

Qwen3-30B-A3B, toplam 30 milyar parametre ve 3 milyar aktif parametreye sahip daha küçük bir MoE modelidir. Ayrıca Qwen 3 serisi içerisinde Qwen3-32B, Qwen3-14B, Qwen3-8B, Qwen3-4B, Qwen3-1.7B ve Qwen3-0.6B olmak üzere altı adet yoğun model bulunmaktadır. Yeni Alibaba Qwen 3 AI modelleri, şirketin yapay zeka alanındaki konumunu daha da güçlendiriyor.

Qwen3'ü tanıtıyoruz!

En son büyük dil modellerimiz olan Qwen3'ü yayınlıyoruz ve açık ağırlıklandırıyoruz; bunlar arasında 2B'den 6B'ye kadar değişen 0.6 MoE modeli ve 235 yoğun model bulunuyor. Amiral gemisi modelimiz Qwen3-235B-A22B, kodlama, matematik, genel… gibi alanların kıyaslama değerlendirmelerinde rekabetçi sonuçlar elde ediyor. resim.twitter.com/JWZkJeHWhC

— Qwen (@Alibaba_Qwen) 28 Nisan 2025

Tüm Qwen 3 modelleri Hibrit Düşünme Modlarını destekler, yani aynı anda hem çıkarımsal AI modelleri hem de geleneksel büyük dil modelleri (LLM) olurlar. “Düşünme modu”nda model adım adım çıkarımlarda bulunabilirken, “Düşünmeme modu”nda model hızlı bir yanıt sağlar. Bu özellik, modelin çeşitli uygulamalarda kullanılma esnekliğini artırır.

Buna ek olarak, Destek Qwen 3 modelleri, dünya genelinde 119'dan fazla dil ve lehçeyi destekler. En çok yönlü çok dilli modellerden biridir. Ayrıca Alibaba, Qwen 3 modelleri için Model Bağlam Protokolü (MCP) desteğini iyileştirerek ek aracılık özelliklerinin kilidini açmıştır. Bu iyileştirme, modellerin bağlamı daha iyi anlamasını ve daha akıllı kararlar almasını sağlar.

Performans açısından, daha büyük Qwen3-235B-A22B modeli, aşağıdakilerle uyumlu rekabetçi sonuçlar sunar: DeepSeek R1 ve Grok 3 Beta ve İkizler 2.5 Pro ve OpenAI o1. İlginç bulduğum nokta ise sadece 3 milyar aktif parametresi olan daha küçük Qwen30-3B-A3B modelinin DeepSeek V3 ve OpenAI'nin GPT-4o modelinden daha iyi performans göstermesi. Bu, yüksek kaynak verimliliğini ve daha küçük model boyutuyla olağanüstü performans elde etme yeteneğini gösterir.

Alibaba, Qwen 3 modellerinin programlama, matematik, fen ve genel becerilerde iyi performans gösterdiğini söylüyor. Genel olarak Qwen 3, Çin'den gelen gelişmiş ve oldukça yetenekli yapay zeka modellerinden oluşan bir aileyi temsil ediyor. Artık Çin, yakında piyasaya sürülecek olan DeepSeek R2 ile Batılı yapay zeka laboratuvarlarıyla rekabet edebilecek konuma geldi. Bu gelişme, Çin'in yapay zeka alanında hızla ilerlediğinin bir yansıması.