Sektör lideri yapay zeka kapsamına ilişkin en son güncellemeler ve özel içerik için günlük ve haftalık bültenlerimize katılın. Daha fazla bilgi edin
Yapay zeka yarışı daha önce hiç olmadığı kadar hızlanıyor. Meta’nın dün yeni ürününü piyasaya sürme hamlesinin ardından açık kaynak Lama 3.1 Önde gelen kapalı kaynak “sınır” modellerine son derece rekabetçi bir alternatif olarak, Fransız yapay zeka girişimi Mistral aynı zamanda ringe de atmıştı.
Girişim, 123 milyar parametreli amiral gemisi açık kaynak modelinin yeni neslini duyurdu: Mistral Large 2. Ancak önemli bir uyarıda bulunmak gerekirse, model yalnızca ticari olmayan araştırma kullanımları için “açık” olarak lisanslanmıştırAçık ağırlıklar da dahil olmak üzere, üçüncü tarafların bunu kendi beğenilerine göre ayarlamasına olanak tanır.
Ticari/kurumsal düzeydeki uygulamalar için kullanmak isteyenlerin, şirketin açıklamasında belirttiği gibi Mistral’den ayrı bir lisans ve kullanım sözleşmesi almaları gerekecek. Blog yazısı ve Araştırma bilimcisi Devendra Singh Chaplot’tan bir X gönderisi.
Llama 3.1’in 405 milyarından daha az sayıda parametreye (veya performansını yönlendiren dahili model ayarlarına) sahip olmasına rağmen, yine de öncekinin performansına yakın.
Şirketin ana platformunda ve bulut ortakları aracılığıyla sunulan Mistral Large 2, orijinal Large modelini temel alıyor ve muhakeme, kod oluşturma ve matematik alanlarında gelişmiş performansla birlikte gelişmiş çok dilli yetenekler sunuyor.
Bu GPT-4 sınıfı olarak selamlanmak GPT-4o, Llama 3.1-405 ve Anthropic’in Claude 3.5 Sonnet’iyle çeşitli kıyaslamalarda yakından eşleşen performansa sahip model.
Mistral, teklifin “maliyet verimliliği, hız ve performansın sınırlarını zorlamaya” devam ettiğini ve kullanıcılara yüksek performanslı yapay zeka uygulamaları oluşturmak için gelişmiş işlev çağırma ve alma dahil yeni özellikler sunduğunu belirtiyor.
Ancak bunun, Meta veya OpenAI’nin kışkırttığı yapay zeka heyecanını ortadan kaldırmak için tasarlanmış tek seferlik bir hareket olmadığını unutmamak önemlidir. Mistral bu alanda agresif bir şekilde hareket ediyor. büyük turlar yükseltmekyenisini başlatıyorum göreve özel modeller (kodlama ve matematik için olanlar dahil) ve endüstri devleriyle ortaklık erişimini genişletmek.
Mistral Büyük 2: Ne bekleniyor?
Şubat ayında Mistral lansmanını yaptığında Orijinal Büyük model 32.000 jetonluk bir bağlam penceresiyle, teklifin “dilbilgisi ve kültürel bağlam konusunda incelikli bir anlayışa” sahip olduğunu ve İngilizce, Fransızca, İspanyolca, Almanca ve İtalyanca da dahil olmak üzere farklı dillerde ana dil akıcılığında metinler oluşturup akıl yürütebileceğini iddia etti.
Modelin yeni sürümü, OpenAI’nin GPT-4o ve GPT-4o mini ve Meta’nın Llama 3.1’iyle eşleşen daha büyük 128.000 bağlam penceresiyle buna dayanıyor.
Ayrıca orijinal dillerin yanı sıra Portekizce, Arapça, Hintçe, Rusça, Çince, Japonca ve Korece de dahil olmak üzere düzinelerce yeni dili destekliyor.
Mistral, genelci modelin, büyük akıl yürütme yetenekleri gerektiren veya sentetik metin oluşturma, kod oluşturma veya RAG gibi oldukça uzmanlaşmış görevler için ideal olduğunu söylüyor.
Üçüncü taraf kıyaslamalarda yüksek performans ve geliştirilmiş kodlama yeteneği
Farklı dilleri kapsayan Çok Dilli MMLU değerlendirmesinde Mistral Large 2, Meta’nın tamamen yeni Llama 3.1-405B ile aynı performansı gösterirken, daha küçük boyutu nedeniyle daha önemli maliyet avantajları sağladı.
Şirket, “Mistral Large 2, uzun bağlam uygulamaları göz önünde bulundurularak tek düğümlü çıkarım için tasarlandı; 123 milyar parametrelik boyutu, tek bir düğümde büyük bir verimle çalışmasına olanak tanıyor” dedi. Blog yazısı.
Ancak tek faydası bu değil.
Orijinal Large modeli, kodlama görevlerinde pek iyi performans göstermedi; Mistral, büyük kod parçaları üzerinde en son sürümü eğittikten sonra bunu düzeltmiş gibi görünüyor.
Yeni model, aralarında Python, Java, C, C++, JavaScript ve Bash’in de bulunduğu 80’den fazla programlama dilinde çok yüksek düzeyde doğrulukla kod üretebiliyor (MultiPL-E karşılaştırmasının ortalamasına göre).
Kod oluşturmaya yönelik HumanEval ve HumanEval Plus kıyaslamalarında Claude 3.5 Sonnet ve Claude 3 Opus’tan daha iyi performans gösterdi ve GPT-4o’nun hemen arkasında yer aldı. Benzer şekilde, Matematik odaklı kriterlerde (GSM8K ve Math Instruct) ikinci sırayı aldı.
Halüsinasyonları en aza indirerek talimatları takip etmeye odaklanın
İşletmeler tarafından yapay zekanın benimsenmesinin artması göz önüne alındığında Mistral, yanıt verirken daha dikkatli ve seçici olacak şekilde modelde ince ayar yaparak Mistral Large’ın halüsinasyonunu en aza indirmeye odaklandı. Bir yanıtı destekleyecek yeterli bilgiye sahip değilse, bunu kullanıcıya basitçe söyleyecek ve tam şeffaflık sağlayacaktır.
Ayrıca şirket, modelin talimatları takip etme yeteneklerini de geliştirerek kullanıcı yönergelerini takip etme ve uzun, çok turlu konuşmaları yönetme konusunda daha iyi hale getirdi. Hatta kurumsal ortamlarda kullanışlı olabilecek mümkün olan her yerde kısa ve öz yanıtlar sağlayacak şekilde ayarlandı.
Şirket şu anda Mistral Large 2’ye API uç nokta platformunun yanı sıra Google Vertex AI, Amazon Bedrock, Azure AI Studio ve IBM WatsonX gibi bulut platformları aracılığıyla erişim sağlıyor. Kullanıcılar, dünyada nasıl çalıştığını görmek için şirketin chatbot’u aracılığıyla onu test edebilirler.
Kaynak: https://venturebeat.com/ai/mistral-shocks-with-new-open-model-mistral-large-2-taking-on-llama-3-1/