Çinli teknoloji şirketi Alibaba Pazartesi günü, şirketin eşleştiğini iddia ettiği ve bazı durumlarda Google ve Openai’den elde edilen en iyi modellerden daha iyi performans gösteren AI modelleri olan Qwen 3’ü yayınladı.
Modellerin çoğu – veya yakında olacak – AI Dev Platform Hugging Yüz ve GitHub’dan “Açık” lisans altında indirilebilir. 0.6 milyar parametreden 235 milyar parametreye kadar değişmektedir. Parametreler kabaca bir modelin problem çözme becerilerine karşılık gelir ve daha fazla parametreye sahip modeller genellikle daha az parametreye sahip olanlardan daha iyi performans gösterir.
Qwen gibi Çin’in orijinal model serilerinin yükselişi, daha yetenekli AI teknolojileri sunmak için Openai gibi Amerikan laboratuvarları üzerindeki baskıyı artırdı. Ayrıca politika yapıcıları, Çinli AI şirketlerinin modelleri eğitmek için gerekli çipleri elde etme yeteneğini sınırlamayı amaçlayan kısıtlamaları uygulamaya yönlendirdiler.
Alibaba’ya göre, Qwen 3 modelleri, karmaşık problemler aracılığıyla zaman ve “akıl” ya da daha basit istekleri hızlı bir şekilde yanıtlayabilmeleri açısından “hibrit” modellerdir. Akıl yürütme, modellerin Openai’nin O3’ü gibi modellere benzer şekilde kendilerini etkili bir şekilde kontrol etmesini sağlar, ancak daha yüksek gecikme pahasına.
Qwen ekibini bir blog yazısında “Kullanıcılara düşünme bütçesini kontrol etme esnekliği sunan düşünme ve düşünmeyen modları sorunsuz bir şekilde entegre ettik” diye yazdı. “Bu tasarım, kullanıcıların göreve özgü bütçeleri daha kolay bir şekilde yapılandırmalarını sağlıyor.”
Alibaba, Qwen 3 modellerinin 119 dili desteklediğini ve yaklaşık 36 trilyon jetonlu bir veri setinde eğitildiğini söylüyor. Jetonlar, bir modelin işlediği ham veri parçalarıdır; 1 milyon jeton yaklaşık 750.000 kelimeye eşdeğerdir. Alibaba, Qwen 3’ün ders kitapları, “soru cevap çiftleri”, kod parçacıkları, AI tarafından üretilen veriler ve daha fazlasının bir kombinasyonu üzerinde eğitildiğini söylüyor.
Alibaba, bu gelişmelerin, diğerleriyle birlikte Qwen 3’ün selefi Qwen 2’ye kıyasla performansını büyük ölçüde artırdığını söylüyor. Programlama yarışmaları için bir platform olan CodeFores’da, en büyük Qwen 3 modeli-QWEN-3-235B-A22B-Openai’nin O3-Mini ve Google’ın Gemini 2.5 Pro’yu yener. Qwen-3-235B-A22B, zorlu bir matematik kıyaslaması olan AIME’nin en son sürümünde O3-Mini ve bir modelin sorunlar hakkında “akıl” yeteneğini değerlendirmek için bir test olan BFCL’nin de en iyisi.
Ancak Qwen-3-235B-A22B herkese açık değil-en azından henüz değil.
En büyük kamu Qwen 3 modeli Qwen3-32b, Çin AI Lab Deepseek’in R1’i de dahil olmak üzere bir dizi tescilli ve açık AI modeliyle rekabet ediyor. Qwen3-32B, Livebench adlı bir doğruluk ölçütü de dahil olmak üzere çeşitli testlerde Openai’nin O1 modelini aşıyor.
Alibaba, Qwen 3’ün araç çağırma özelliklerinde “mükemmel” olduğunu ve ayrıca talimatları takip ettiğini ve belirli veri formatlarını kopyaladığını söylüyor. İndirme modellerini yayınlamanın yanı sıra, Qwen 3, havai fişek AI ve Hyperbolic dahil bulut sağlayıcılarından edinilebilir.
AI Cloud Host Baseten’in kurucu ortağı ve CEO’su Tuhin Srivastava, Qwen 3’ün Openai’s gibi kapalı kaynaklı sistemlere ayak uydurarak açık modellerin trend çizgisinde başka bir nokta olduğunu söyledi.
“ABD, çiplerin satışlarını ve Çin’den satın alımları kısıtlamada ikiye katlanıyor, ancak Qwen 3 gibi son teknoloji ürünü ve açık olan modeller […] Kuşkusuz yurt içinde kullanılacak ”dedi. TechCrunch’a yaptığı açıklamada. [as well as] Antropik ve Openai gibi kapalı model şirketler aracılığıyla raftan satın almak. ”
Kaynak: https://techcrunch.com/2025/04/28/alibaba-unveils-qwen-3-a-family-of-hybrid-ai-reasoning-models/