Yeni bir açık kaynak dil modeli, dünyanın en iyilerinin tahtına oturdu. Hugging Face’in son sıralamalarıDoğal dil işleme (NLP) araştırma ve uygulamaları için önde gelen platformlardan biri.
“adlı model”Smaug-72B”, bugün startup tarafından halka açık olarak yayınlandı Abaküs AIİşletmelerin yapay zeka ve makine öğrenimi alanındaki zor sorunları çözmelerine yardımcı olan. Smaug-72B teknik olarak “ince ayarlı” bir versiyondur.Qwen-72BAlibaba Group’taki araştırmacılardan oluşan bir ekip olan Qwen tarafından yalnızca birkaç ay önce piyasaya sürülen bir başka güçlü dil modeli.
Bugünkü sürümle ilgili en dikkate değer şey, Smaug-72B’nin, en popüler kriterlerin birçoğunda sırasıyla OpenAI ve Mistral tarafından geliştirilen en gelişmiş açık kaynaklı büyük dil modellerinden ikisi olan GPT-3.5 ve Mistral Medium’dan daha iyi performans göstermesidir. Smaug-72B aynı zamanda türetildiği model olan Qwen-72B’yi de bu değerlendirmelerin çoğunda önemli bir farkla geride bırakıyor.
Göre Sarılma Yüzü Açık LLM liderlik sıralamasıAçık kaynak dil modellerinin çeşitli doğal dil anlama ve oluşturma görevlerindeki performansını ölçen Smaug-72B, artık tüm önemli LLM değerlendirmelerinde ortalama 80’in üzerinde puan alan ilk ve tek açık kaynak modelidir.
Model hâlâ insan düzeyindeki performansın 90-100 puanlık ortalama göstergesinin gerisinde kalsa da, doğuşu, açık kaynak yapay zekanın yakında Big Tech’in uzun süredir gizlilik içinde gizlenen yeteneklerine rakip olabileceğinin sinyallerini veriyor. Kısacası Smaug-72B’nin piyasaya sürülmesi, bir avuç zengin şirketin ötesindekilerin yaratıcılığından yararlanarak yapay zekanın ilerleme şeklini temelden yeniden şekillendirebilir.
Açık kaynak avantajı
“Abacus AI’den Smaug-72B şu anda Hugging Face’te mevcut, açık LLM sıralamasında en üst sırada yer alıyor ve ortalama 80 puana sahip ilk model!! Başka bir deyişle, dünyanın en iyi açık kaynak temel modelidir,” dedi Abacus AI CEO’su Bindu Reddy, X.com’daki bir gönderide.
“Bir sonraki hedefimiz bu teknikleri bir araştırma makalesi olarak yayınlamak ve bunları miqu (LLama-2’nin 70B’lik ince ayarı) dahil olmak üzere en iyi Mistral Modellerinden bazılarına uygulamak olacaktır” diye ekledi. “Kullandığımız teknikler özellikle muhakeme ve matematik becerilerini hedef alıyor, bu da yüksek GSM8K puanlarını açıklıyor! Gelecek makalemiz daha fazlasını açıklayacak.”
Bugünkü sürümle birlikte Smaug-72B, doğal dil işleme ve açık kaynak yapay zeka alanında dikkate değer bir başarı olarak kabul edilen Hugging Face Open LLM sıralamasında ortalama 80 puan alan ilk açık kaynaklı model oldu.
Smaug-72B, Abacus AI’nin ince ayar sürecine uyguladığı teknikler sayesinde özellikle muhakeme ve matematik görevlerinde başarılı oluyor. Ayrıntılı olarak anlatılacak olan bu teknikler yaklaşan araştırma makalesibüyük dil modellerinin zayıf yönlerini hedefleyin ve yeteneklerini geliştirin.
Smaug-72B son zamanlarda manşetlere çıkan tek açık kaynaklı dil modeli değil. Qwen-72B’nin arkasındaki grup olan Qwen de Qwen 1.5 yayınlandı0,5B’den 72B’ye kadar parametreler arasında değişen küçük, güçlü dil modellerinden oluşan bir paket.
Qwen 1.5 Mistral-Medium ve GPT-3.5 gibi popüler açık kaynak modellerinden daha iyi performans gösterir, 32k bağlam uzunluğuna sahiptir ve hızlı ve yerel çıkarım için çeşitli araç ve platformlarla çalışır. Qwen ayrıca açık kaynaklı Qwen-VL-MaxGoogle ve OpenAI tarafından geliştirilen en gelişmiş tescilli görüş dili modellerinden Gemini Ultra ve GPT-4V’ye rakip olan yeni bir geniş görüş dili modeli.
Yapay zekanın geleceği için çıkarımlar
Ortaya çıkması Smaug-72B Ve Qwen 1.5 AI topluluğunda ve ötesinde pek çok heyecan ve tartışmaya yol açtı. Pek çok uzman ve etki sahibi, Abacus AI ve Qwen’in başarılarını övdü ve açık kaynaklı yapay zekaya katkılarından dolayı hayranlıklarını dile getirdi.
Yapay zeka fenomeni ve analisti Sahar Mor, “Bir yıldan daha kısa bir süre önce hepimizin Dolly gibi modeller konusunda heyecanlandığına inanmak zor” dedi. bir Linkedin gönderisindegeçen yıl açık kaynak modellerinin kaydettiği ilerlemeden keyif alıyor.
Smaug-72B ve Qwen 1.5 şu anda herkesin indirebileceği, kullanabileceği ve değiştirebileceği Hugging Face’te mevcuttur. Abacus AI ve Qwen de modellerini llmsys insan değerlendirme skor tablosuDil modellerinin insan benzeri görevler ve senaryolar üzerindeki performansını değerlendiren yeni bir kıyaslamadır. Abacus AI ve Qwen ayrıca daha fazla açık kaynaklı model oluşturma ve bunları çeşitli alan ve uygulamalara uygulama dahil olmak üzere gelecekteki proje ve hedeflerine de işaret etti.
Smaug-72B ve Qwen 1.5 hızlı ve Bu yıl açık kaynaklı yapay zekanın dikkate değer gelişimi. Büyük teknoloji şirketlerinin egemenliğine ve tekeline meydan okuyan ve herkes için yeni olanaklar ve fırsatlar açan yeni bir yapay zeka inovasyonu ve demokratikleşme dalgasını temsil ediyorlar. Smaug-72B’nin Hugging Face sıralamasında ne kadar süre zirvede kalacağını yalnızca zaman gösterecek, ancak şimdilik açık kaynak yapay zekanın bu yıla başlamak için büyük bir an yaşadığını söyleyebiliriz.
VentureBeat’in misyonu teknik karar vericilerin dönüştürücü kurumsal teknoloji hakkında bilgi edinmeleri ve işlem yapmaları için dijital bir şehir meydanı olmaktır. Brifinglerimizi keşfedin.
Kaynak: https://venturebeat.com/ai/meet-smaug-72b-the-new-king-of-open-source-ai/