Meta, Llama üretken yapay zeka modelleri ailesinin en yeni üyesini duyurdu: Llama 3.3 70B.
Meta’nın üretken yapay zekadan sorumlu başkan yardımcısı Ahmad Al-Dahle, X ile ilgili bir gönderide salt metin içeren Llama 3.3 70B’nin, Meta’nın en büyük Llama modeli olan Llama 3.1 405B’nin performansını daha düşük maliyetle sunduğunu söyledi.
Al-Dahle, “Eğitim sonrası tekniklerdeki en son gelişmelerden yararlanan bu model, temel performansı önemli ölçüde daha düşük bir maliyetle artırıyor” diye yazdı.
Ahmad Al-Dahle, Llama 3.3 70B’nin Google’ın Gemini 1.5 Pro’sundan, OpenAI’nin GPT-4o’sundan ve Amazon’un yeni çıkan Nova Pro’sundan daha iyi performans gösterdiğini gösteren bir grafik yayınladı. Bir Meta sözcüsü, e-posta aracılığıyla modelin matematik, genel bilgi, talimatları takip etme ve uygulama kullanımı gibi alanlarda iyileştirmeler sunması gerektiğini söyledi.
AI geliştirme platformu Hugging Face’ten ve resmi Llama web sitesi de dahil olmak üzere diğer kaynaklardan indirilebilen Llama 3.3 70B, Meta’nın çeşitli amaçlarla kullanılabilecek ve ticarileştirilebilecek “açık” modellerle AI alanına hakim olma yönündeki en son oyunu. amaçlar.
Meta’nın şartları, belirli geliştiricilerin Lama modellerini nasıl kullanabileceğini kısıtlıyor; Aylık kullanıcısı 700 milyondan fazla olan platformların şirketten özel izin alması gerekiyor. Ancak birçok geliştirici ve şirket için Lama modellerinin tam anlamıyla “açık” olmamasının hiçbir önemi yok. Meta’ya göre Lama modelleri 650 milyondan fazla indirme sayısına ulaştı.
Meta, Lama’yı kendi amaçları için de kullandı. Şirketin CEO’su Mark Zuckerberg’in Cuma günü paylaştığı Instagram gönderisine göre, tamamen Llama modelleriyle desteklenen, şirketin yapay zeka asistanı Meta AI’nın şu anda aylık yaklaşık 600 milyon aktif kullanıcısı var. Zuckerberg, Meta AI’nın dünyada en çok kullanılan AI asistanı olma yolunda ilerlediğini iddia ediyor.
Lama’nın açık doğası Meta için bir lütuf ve lanet olmuştur.
Kasım ayında Çinli askeri araştırmacıların savunma chatbotu geliştirmek için bir Llama modeli kullandıklarına dair bir rapor ortaya çıktı. Meta buna, Llama modellerini ABD’li savunma ortaklarının kullanımına sunarak yanıt verdi.
Meta ayrıca, yapay zeka için yasal ve düzenleyici bir çerçeve oluşturan AB yasası olan Yapay Zeka Yasası’na uyma yeteneği hakkındaki endişelerini de dile getirerek yasanın uygulanmasını “fazla öngörülemez” olarak nitelendirdi. Şirket için söz konusu olan, AB’nin gizlilik yasası olan GDPR’nin yapay zeka eğitimine ilişkin ilgili hükümleridir. Meta, yapay zeka modellerini, bu seçeneği seçmemiş olan Instagram ve Facebook kullanıcılarının kamuya açık verileri (Avrupa’da GDPR garantilerine tabi olan veriler) üzerine eğitiyor.
Bu yılın başlarında AB düzenleyicileri, şirketin GDPR uyumluluğunu değerlendirirken Meta’nın Avrupa kullanıcı verileriyle ilgili eğitimi durdurmasını talep etmişti. Meta yumuşadı ve aynı zamanda GDPR’nin “ilerlemeyi reddetmeyen” “modern bir yorumu” çağrısında bulunan açık bir mektubu onayladı.
Diğer yapay zeka laboratuvarlarının karşılaştığı teknik zorluklardan muaf olmayan Meta, gelecek nesil Lama modellerini eğitmek ve hizmet etmek için bilgi işlem altyapısını güçlendiriyor. Şirket Çarşamba günü Louisiana’da şimdiye kadar inşa ettiği en büyük yapay zeka veri merkezi olan 10 milyar dolarlık bir yapay zeka veri merkezi inşa edeceğini duyurdu.
Zuckerberg, Meta’nın ağustos ayındaki 4. çeyrek kazanç açıklamasında, şirketin bir sonraki büyük Llama modeli seti olan Llama 4’ü eğitmek için Llama 3’ü eğitmek için gerekenden 10 kat daha fazla hesaplamaya ihtiyaç duyacağını söyledi.
Büyük dil modellerini eğitmek maliyetli bir iş olabilir. Meta’nın sermaye harcamaları, sunuculara, veri merkezlerine ve ağ altyapısına yapılan yatırımların etkisiyle, bir önceki yılki 6,4 milyar dolardan 2024’ün ikinci çeyreğinde yaklaşık %33 artarak 8,5 milyar dolara yükseldi.
Kaynak: https://techcrunch.com/2024/12/06/meta-unveils-a-new-more-efficient-llama-model/