Nvidia, Sarılma Yüz Ve ServiceNow Açık erişimli büyük dil modellerinden (LLM’ler) oluşan yeni bir aile olan StarCoder2 ile kod oluşturmada yapay zeka konusunda çıtayı zorluyorlar.
Bugün üç farklı boyutta mevcut olan modeller, işletmelere yardımcı olmak amacıyla düşük kaynaklı olanlar da dahil olmak üzere 600’den fazla programlama diliyle eğitilmiştir. kodla ilgili çeşitli görevleri hızlandırın geliştirme iş akışlarında. Açık ortamda geliştirildiler BigCode Projesi, kod için büyük dil modellerinin sorumlu bir şekilde geliştirilmesini ve kullanılmasını sağlamak amacıyla ServiceNow ve Hugging Face’in ortak çabasıdır. Açık Sorumlu Yapay Zeka Lisansları (OpenRAIL) kapsamında telifsiz olarak kullanıma sunuluyorlar.
“StarCoder2, açık bilimsel iş birliği ve sorumlu yapay zeka uygulamaları ile etik veri tedarik zincirinin birleşik gücünün bir kanıtıdır. Son teknoloji ürünü açık erişim modeli, geliştirici üretkenliğini artırmak için önceki üretken yapay zeka performansını geliştirir ve geliştiricilere kod oluşturma yapay zekasının avantajlarına eşit erişim sağlar; bu da her büyüklükteki kuruluşun tüm işlerini daha kolay karşılamasını sağlar. ServiceNow’un StarCoder2 geliştirme ekibinin lideri ve BigCode’un eş başkanı Harm de Vries, bir açıklamada şunları söyledi.
StarCoder2: Üç farklı ihtiyaca yönelik üç model
BigCode ise orijinal StarCoder LLM 15B parametreli tek bir boyutta piyasaya sürüldü ve yaklaşık 80 programlama dili üzerinde eğitim aldı; üç farklı boyuttaki (3B, 7B ve 15B) modellerle bunun ötesindeki en yeni nesil model ve 619 programlama dili üzerinde eğitim aldı. BigCode’a göre yeni modellerin eğitim verileri şu şekilde biliniyor: Yığıngeçen sefer kullanılandan yedi kat daha büyüktü.
Daha da önemlisi BigCode topluluğu, modellerin COBOL, matematik ve program kaynak kodu tartışmaları gibi düşük kaynaklı programlama dillerini anlayabilmesini ve oluşturabilmesini sağlamak amacıyla en yeni nesil için yeni eğitim teknikleri kullandı.
En küçük 3 milyar parametreli model, ServiceNow’un Fast LLM çerçevesi kullanılarak eğitilirken, 7B modeli Hugging Face’in nanotron çerçevesiyle geliştirildi. Her ikisi de daha az bilgi işlem gerektirirken yüksek performanslı metinden koda ve metinden iş akışına nesiller sunmayı amaçlıyor.
Bu arada, 15 milyar parametrelik en büyük model uçtan uca eğitildi ve optimize edildi Nvidia NeMo bulutta yerel çerçeve ve Nvidia TensorRT‑LLM yazılımı.
Bu modellerin farklı kodlama senaryolarında ne kadar iyi performans gösterdiğini zaman gösterecek olsa da şirketler, en küçük 3B modelinin performansının tek başına orijinal 15B StarCoder LLM’nin performansıyla eşleştiğini fark etti.
Kurumsal ekipler, ihtiyaçlarına bağlı olarak bu modellerden herhangi birini kullanabilir ve bunları farklı kullanım senaryolarına göre kurumsal verileri üzerinde daha ayrıntılı şekilde ayarlayabilir. Bu, uygulama kaynak kodu oluşturma, iş akışı oluşturma ve metin özetleme, kod tamamlama, gelişmiş kod özetleme ve kod parçacıklarının alınması gibi özel görevlerden herhangi biri olabilir.
Şirketler, modellerin daha geniş ve daha derin eğitimleriyle, veri havuzu bağlamı sağladığını, doğru ve bağlama duyarlı tahminlere olanak sağladığını vurguladı. Sonuçta tüm bunlar, mühendislerin ve geliştiricilerin daha kritik görevlere odaklanması için zaman tasarrufu sağlarken aynı zamanda geliştirmeyi hızlandırmanın yolunu açıyor.
Nvidia’nın uygulamalı araştırmadan sorumlu başkan yardımcısı Jonathan Cohen, basın açıklamasında şunları söyledi: “Her yazılım ekosisteminin özel bir programlama dili olduğundan, kod yüksek lisansı her sektörde verimlilik ve yenilik alanında atılımlara yol açabilir.”
“Nvidia’nın ServiceNow ve Hugging Face ile olan işbirliği güvenli, sorumlu bir şekilde geliştirilmiş modeller sunuyor ve küresel topluluğa fayda sağlayacağını umduğumuz sorumlu üretken yapay zekaya daha geniş erişimi destekliyor” diye ekledi.
StarCoder2’ye nasıl başlanır?
Daha önce de belirtildiği gibi StarCoder2 ailesindeki tüm modeller Open RAIL-M lisansı altında telifsiz erişim ve kullanımla sunuluyor. Destekleyici kod BigCode projesinin GitHub deposunda mevcuttur. Alternatif olarak ekipler ayrıca üç modeli de şuradan indirip kullanabilir: Sarılma Yüz.
Bununla birlikte, Nvidia tarafından eğitilen 15B modeli de geliyor Nvidia Yapay Zeka Vakfıgeliştiricilerin doğrudan tarayıcılarından veya bir API uç noktası aracılığıyla bunlarla deneme yapmasına olanak tanır.
StarCoder, yapay zeka destekli kod oluşturma alanındaki ilk giriş olmasa da, projenin en yeni neslinin getirdiği çok çeşitli seçenekler, işletmelerin uygulama geliştirmede Yüksek Lisans’tan yararlanırken aynı zamanda bilgi işlemden tasarruf etmelerine kesinlikle olanak tanıyor.
Bu alandaki diğer önemli oyuncular OpenAI ve Amazon’dur. İlki, GitHub yardımcı pilot hizmetiikincisi ise CodeWhisper alet. Replit’in de güçlü bir rekabeti var. birkaç küçük AI kodlama modeli Sarılma Yüzünde ve Kodenyumyakın zamanda 500 milyon dolarlık bir değerlemeyle 65 milyon dolarlık B serisi finansmanı ele geçirdi.
VentureBeat’in misyonu teknik karar vericilerin dönüştürücü kurumsal teknoloji hakkında bilgi edinmeleri ve işlem yapmaları için dijital bir şehir meydanı olmaktır. Brifinglerimizi keşfedin.
Kaynak: https://venturebeat.com/ai/nvidia-hugging-face-and-servicenow-release-new-starcoder2-llms-for-code-generation/