Meta, Llama ailesinde yeni bir AI modelleri olan Lama 4 koleksiyonunu yayınladı – bir Cumartesi günü daha az değil.
Toplamda dört yeni model var: Lama 4 Scout, Lama 4 Maverick ve Lama 4 Behemoth. Meta, hepsi onlara “geniş görsel anlayış” sağlamak için “büyük miktarlarda etiketlenmemiş metin, görüntü ve video verisi” konusunda eğitildi.
Meta’nın önceki amiral gemisi lama modellerinden daha eşit veya daha iyi performans gösteren Çin AI laboratuvar Deepseek’in açık modellerinin başarısı, Llama gelişimini aşırı hıza attı. Meta’nın, Deepseek’in R1 ve V3 gibi modelleri koşu ve dağıtma maliyetini nasıl düşürdüğünü deşifre etmek için savaş odalarını karıştırdığı söyleniyor.
Scout ve Maverick, Lama.com’da ve Meta’nın ortaklarından, AI Dev Platform Hugging Face dahil olmak üzere, Behemoth hala eğitimde. Meta, WhatsApp, Messenger ve Instagram gibi uygulamalar arasında AI ile çalışan asistan olan Meta Ai’nin 40 ülkede Llama 4’ü kullanmak üzere güncellendiğini söylüyor. Multimodal özellikler şimdilik ABD ile sınırlıdır.
Bazı geliştiriciler Lama 4 lisansı ile ilgili sorun yaşayabilir.
Kullanıcıların ve şirketlerin AB’de “ikamet ettiği” veya “ana iş yeri” olan şirketlerin, muhtemelen bölgenin yapay zekası ve veri gizlilik yasaları tarafından uygulanan yönetişim gereksinimlerinin sonucu olan modelleri kullanması veya dağıtması yasaktır. (Geçmişte, Meta bu yasaları aşırı külfetli olarak reddedmiştir.) Buna ek olarak, önceki Lama sürümlerinde olduğu gibi, aylık 700 milyondan fazla aktif kullanıcısı olan şirketler, Meta’dan Meta’dan tamamen kendi takdirine izin verebilecek veya reddedebilecek özel bir lisans talep etmelidir.
Meta bir blog yazısında, “Bu lama 4 modelleri, Lama ekosistemi için yeni bir çağın başlangıcını işaret ediyor,” diye yazdı Meta bir blog yazısında. “Bu, Lama 4 koleksiyonunun sadece başlangıcı.”
Meta, Llama 4’ün, eğitim ve cevaplama için daha hesaplama açısından verimli olan uzmanlar (MOE) mimarisinin bir karışımını kullanan ilk model kohortu olduğunu söylüyor. MOE mimarileri temel olarak veri işleme görevlerini alt görevlere ayırır ve daha sonra daha küçük, özel “uzman” modellere devreder.
Örneğin Maverick’in toplam 400 milyar parametresi var, ancak sadece 17 milyar aktif 128 “Uzman” aralığındaki parametreler. (Parametreler kabaca bir modelin problem çözme becerilerine karşılık gelir.) Scout, 17 milyar aktif parametreye, 16 uzmana ve toplam 109 milyar parametreye sahiptir.
Meta’nın iç testine göre, şirketin yaratıcı yazma gibi “genel asistan ve sohbet” kullanım durumları için en iyisi olduğunu söylediği Maverick, Openai’nin GPT-4O ve Google’ın Gemini 2.0 gibi modelleri belirli kodlama, akıl yürütme, çok dilli, uzun kontiz ve görüntü ölçütleri gibi aşıyor. Bununla birlikte, Maverick Google’ın Gemini 2.5 Pro, Antropic’in Claude 3.7 sonnet ve Openai’nin GPT-4.5 gibi daha yetenekli son modelleri ölçmüyor.
İzcinin güçlü yönleri, büyük kod tabanları üzerinde belge özetleme ve akıl yürütme gibi görevlerde yatar. Benzersiz bir şekilde, çok geniş bir bağlam penceresi var: 10 milyon jeton. (“Jetonlar” ham metin parçalarını temsil eder – örneğin “fan”, “TAS” ve “TIC” olarak bölünmüş “fantastik” kelimesi, sade İngilizce’de, Scout görüntülerde ve milyonlarca kelimeye kadar alabilir ve son derece uzun belgelerle işleme ve çalışmasına izin verebilir.
Scout tek bir NVIDIA H100 GPU’da çalışabilirken, Meta’nın hesaplamalarına göre Maverick bir NVIDIA H100 DGX sistemi veya eşdeğeri gerektirir.
Meta’nın yayınlanmamış behemoth’unun daha da sert bir donanıma ihtiyacı olacaktır. Şirkete göre, Behemoth’un 288 milyar aktif parametresi, 16 uzman ve yaklaşık iki trilyon toplam parametresi var. Meta’nın dahili kıyaslama, matematik problem çözme gibi STEM becerilerini ölçen çeşitli değerlendirmelerde GPT-4.5, Claude 3.7 sonnet ve Gemini 2.0 Pro (ancak 2.5 Pro değil) daha iyi performans gösteriyor.
Dikkat çekici bir şekilde, Llama 4 modellerinin hiçbiri Openai’nin O1 ve O3-mini çizgileri boyunca uygun bir “akıl yürütme” modeli değildir. Akıl yürütme modelleri cevaplarını kontrol edin ve genellikle sorulara daha güvenilir bir şekilde yanıt verir, ancak sonuç olarak cevaplar sunmak için geleneksel, “mantıklı olmayan” modellerden daha uzun sürer.
İlginç bir şekilde, Meta, “çekişmeli” soruları daha az cevaplamayı reddetmek için tüm Llama 4 modellerini ayarladığını söylüyor. Şirkete göre, Llama 4, önceki Lama modellerinin ürününün yapamayacağı “tartışılan” siyasi ve sosyal konulara yanıt veriyor. Buna ek olarak, şirket, Lama 4’ün düz bir şekilde eğilmesini istemeyen “önemli ölçüde daha dengeli” olduğunu söylüyor.
“[Y]güvenebilir [Lllama 4] yargılamadan yararlı, olgusal yanıtlar sağlamak için, ”dedi bir meta sözcüsü TechCrunch’a.[W]Daha fazla soruyu cevaplaması için lama’yı daha duyarlı hale getirmeye devam ediyor, çeşitli farklı bakış açılarına yanıt verebilir […] Ve diğerleri hakkında bazı görüşleri desteklemiyor. ”
Bu ince ayarlar, bazı Beyaz Saray müttefikleri AI chatbots’u çok politik olarak “uyandı” ile suçluyor.
Başkan Donald Trump’ın milyarder Elon Musk ve Crypto ve AI “Çar” David Sacks dahil olmak üzere yakın sırdaşlarının çoğu, popüler AI Chatbots sansürü muhafazakar görüşlerinin olduğunu iddia etti. Sacks, tarihsel olarak Openai’nin chatgpt’ini “uyanmak için programlanmış” ve siyasi konu hakkında gerçek olmayan olarak seçti.
Gerçekte, AI’daki önyargı inatçı bir teknik sorundur. Musk’un kendi AI şirketi Xai, diğerleri hakkında bazı politik görüşleri desteklemeyen bir sohbet botu oluşturmak için mücadele etti.
Bu, Openai dahil olmak üzere şirketlerin daha önce olduğundan daha fazla soruyu cevaplamak için AI modellerini ayarlamasını, özellikle tartışmalı konularla ilgili soruları durduramadı.
Kaynak: https://techcrunch.com/2025/04/05/meta-releases-llama-4-a-new-crop-of-flagship-ai-models/