Mistral’s Large 2, Meta ve OpenAI’nin en son modellerine yanıttır

Sınır yapay zeka modelleri için yağmur yağdığında sağanak yağıyor. Mistral, çarşamba günü yeni amiral gemisi modeli Large 2’yi piyasaya sürdü; bu modelin kod oluşturma, matematik ve muhakeme açısından OpenAI ve Meta’nın en yeni modelleriyle aynı seviyede olduğunu iddia ediyor.

Mistral Large 2’nin piyasaya sürülmesi, Meta’nın en yeni ve en büyük açık kaynak modeli Llama 3.1 405b’yi piyasaya sürmesinden sadece bir gün sonra gerçekleşti. Mistral, Large 2’nin açık modeller için performans ve maliyet açısından çıtayı yükselttiğini ve bunu bir dizi kıyaslamayla desteklediğini söylüyor.

Büyük 2, kod oluşturma ve matematik performansı açısından Llama 3.1 405B’yi geride bırakıyor gibi görünüyor ve bunu parametrelerin üçte birinden daha azıyla yapıyor: kesin olarak 123 milyar.

Bir basın açıklamasında Mistral, eğitim sırasında odaklandığı en önemli alanlardan birinin modelin halüsinasyon sorunlarını en aza indirmek olduğunu söyledi. Şirket, Large 2’nin yanıtlarında daha anlayışlı olacak şekilde eğitildiğini, makul görünen bir şeyi uydurmak yerine bir şeyi bilmediğini kabul ettiğini söylüyor.

Paris merkezli AI girişimi, yakın zamanda General Catalyst liderliğindeki B Serisi finansman turunda 6 milyar dolarlık değerlemeyle 640 milyon dolar topladı. Mistral, yapay zeka alanına yeni girenlerden biri olmasına rağmen, yapay zeka modellerini hızlı bir şekilde son teknolojiye veya yakın bir noktaya ulaştırıyor.

Ancak Mistral’in modellerinin, diğerlerinin çoğu gibi, geleneksel anlamda açık kaynak olmadığını belirtmek önemlidir; modelin herhangi bir ticari uygulaması ücretli bir lisans gerektirir. Ve örneğin GPT-4o’dan daha açık olmasına rağmen, dünyada çok az kişi bu kadar büyük bir modeli uygulayacak uzmanlığa ve altyapıya sahiptir. (Elbette bu, Lama’nın 405 milyar parametresi için iki katına çıkar.)

Mistral Large 2’de eksik olan ve Meta’nın dünkü Llama 3.1 sürümünde de olmayan bir şey multimodal yeteneklerdir. OpenAI, görüntü ve metni aynı anda işleyebilen çok modlu yapay zeka sistemleri açısından rekabetin çok ilerisindedir; bu, bazı startup şirketlerin giderek daha fazla geliştirmek istediği bir özelliktir.

Modelin 128.000 token penceresi var, bu da Büyük 2’nin tek bir komut isteminde çok fazla veri alabileceği anlamına geliyor (128.000 token kabaca 300 sayfalık bir kitaba eşittir). Mistral’in yeni modeli aynı zamanda gelişmiş çoklu dil desteğini de içeriyor. Large 2, İngilizce, Fransızca, Almanca, İspanyolca, İtalyanca, Portekizce, Arapça, Hintçe, Rusça, Çince, Japonca ve Korece’nin yanı sıra 80 kodlama dilini anlıyor. Özellikle Mistral, Büyük 2’nin gevezelik etme eğiliminde olan önde gelen yapay zeka modellerinden daha kısa ve öz yanıtlar ürettiğini iddia ediyor.

Mistral Large 2, Google Vertex AI, Amazon Bedrock, Azure AI Studio ve IBM watsonx.ai’de kullanılabilir. Ayrıca yeni modeli Mistral’in le Plateforme’unda “mistral-large-2407” adı altında kullanabilir ve girişimin ChatGPT rakibi le Chat’te ücretsiz olarak test edebilirsiniz.

Kaynak: https://techcrunch.com/2024/07/24/mistral-releases-large-2-meta-openai-ai-models/