Sektör lideri yapay zeka kapsamına ilişkin en son güncellemeler ve özel içerik için günlük ve haftalık bültenlerimize katılın. Daha fazla bilgi edin
iyi finanse edilmiş Fransız yapay zeka girişimi Mistralonun için bilinen güçlü açık kaynak yapay zeka modelleribugün büyüyen büyük dil modelleri (LLM’ler) ailesinde iki yeni giriş başlattı: matematik tabanlı bir model ve programcılar ve geliştiriciler için olarak bilinen yeni mimariye dayalı bir kod oluşturma modeli. Mamba geçen yılın sonlarında başka araştırmacılar tarafından geliştirildi.
Mamba, dikkat mekanizmalarını basitleştirerek önde gelen LLM’lerin çoğunun kullandığı transformatör mimarisinin verimliliğini artırmayı amaçlıyor. Mamba tabanlı modeller, daha yaygın olan transformatör tabanlı modellerin aksine, daha hızlı çıkarım sürelerine ve daha uzun içeriğe sahip olabilir. AI21 dahil diğer şirketler ve geliştiriciler şunları yayınladı: buna dayalı yeni yapay zeka modelleri.
Şimdi bu yeni mimariyi kullanan Mistral, uygun bir şekilde adlandırıldı: Codestral Mamba 7B, daha uzun metin girişlerinde bile hızlı yanıt süresi sunar. Codestral Mamba, özellikle daha fazla yerel kodlama projesi için kod üretkenliği kullanım durumlarında iyi çalışır.
Mistral, Mistral’ın l’de kullanımı ücretsiz olacak modeli test etti.bir Platform 256.000 jetona kadar girdileri işleyen API — OpenAI’nin GPT-4o’sunun iki katı.
Kıyaslama testlerinde Mistral, Codestral Mamba’nın HumanEval testlerinde rakip açık kaynak modelleri CodeLlama 7B, CodeGemma-1.17B ve DeepSeek’ten daha iyi performans gösterdiğini gösterdi.
Geliştiriciler Codestral Mamba’yı GitHub deposundan ve HuggingFace aracılığıyla değiştirebilir ve dağıtabilir. Açık kaynaklı Apache 2.0 lisansı ile satışa sunulacak.
Mistral iddia etti Codestral’ın önceki sürümü daha iyi performans gösterdi CodeLlama 70B ve DeepSeek Coder 33B gibi diğer kod oluşturucular.
Kod oluşturma ve kodlama asistanları, yapay zeka modelleri için yaygın olarak kullanılan uygulamalar haline geldi. GitHub’ın Yardımcı PilotuOpenAI tarafından desteklenmektedir, Amazon’un CodeWhisperer’ıVe Kodenyum popülerlik kazanıyor.
Mathstral STEM kullanım durumları için uygundur
Mistral’ın ikinci model lansmanı Mathstral 7B, özellikle matematikle ilgili akıl yürütme ve bilimsel keşif için tasarlanmış bir yapay zeka modeli. Mistral, Mathstral’ı Project Numina ile geliştirdi.
Mathstral’ın 32K içerik penceresi vardır ve Apache 2.0 açık kaynak lisansı altında olacaktır. Mistral, modelin matematik muhakeme için tasarlanan her modelden daha iyi performans gösterdiğini söyledi. Daha fazla çıkarım süresi hesaplamasıyla kıyaslamalarda “önemli ölçüde daha iyi sonuçlar” elde edilebilir. Kullanıcılar onu olduğu gibi kullanabilir veya modele ince ayar yapabilir.
Mistral bir blog yazısında şunları söyledi: “Mathstral, belirli amaçlara yönelik modeller oluştururken elde edilen mükemmel performans/hız değişimlerinin bir başka örneğidir; bu, la Plateforme’de özellikle yeni ince ayar yetenekleriyle aktif olarak desteklediğimiz bir geliştirme felsefesidir.”
Mathstral’a Mistral’in la Plataforme ve HuggingFace aracılığıyla erişilebilir.
Modellerini açık kaynaklı bir sistem üzerinde sunma eğiliminde olan Mistral, OpenAI ve Anthropic gibi diğer AI geliştiricileriyle sürekli olarak rekabet ediyor.
Son zamanlarda 640 milyon dolar topladı B serisi fonlamada değerlemesi 6 milyar dolara yaklaştı. Şirket aynı zamanda teknoloji devlerinden yatırım aldı Microsoft ve IBM gibi.
Kaynak: https://venturebeat.com/ai/mistral-releases-codestral-mamba-for-faster-longer-code-generation/