Sektör lideri yapay zeka kapsamına ilişkin en son güncellemeler ve özel içerik için günlük ve haftalık bültenlerimize katılın. Daha fazla bilgi edin
Küçük dil modellerine yönelik eğilim hızlanıyor Arcee AI Ocak 2024’te 5,5 milyon dolarlık başlangıç turunu duyurduktan yalnızca 6 ay sonra 24 milyon dolarlık A Serisi finansmanını duyurdu. Şirket ayrıca platformunun barındırılan bir SaaS sürümü olan Arcee Cloud’un lansmanını da duyurdu. Bu yeni teklif, mevcut VPC içi dağıtım seçeneği Arcee Enterprise’ı tamamlıyor.
Emergence Capital liderliğindeki yeni tur, yatırımcıların daha küçük, daha verimli yapay zeka modellerinin potansiyeline olan güveninin arttığına işaret ediyor. Arcee AI Kurucu Ortağı ve CEO’su Mark McQuade, VentureBeat ile yaptığı özel röportajda “A Serisi, çözümümüzü yeni bulut platformumuz aracılığıyla kitlelere ulaştırmak için bize kaynak sağlıyor” dedi.
Küçük dil modelleri (SLM’ler), özellikle soru yanıtlama uygulamaları olmak üzere belirli alanlardaki kuruluşlar için hızla tercih edilen bir çözüm haline geliyor. McQuade, “İK kullanım durumunuz için bir model istiyorsanız, 1967’de En İyi Film Akademi Ödülünü kimin kazandığını bilmesi umurunda değil” dedi. “7 milyar parametre kadar küçük modellerde büyük başarı elde ettik.”
McQuade, vergi yardımı, eğitim desteği, İK sorguları ve tıbbi soru yanıtlama dahil olmak üzere birçok kullanım örneğinin altını çizdi. Veri çıkarma veya otomatik analiz görevlerinden farklı olarak bu uygulamalar, kullanıcı sorgularına doğru, bağlama duyarlı yanıtlar sağlamaya odaklanır. SLM’lerin bu uzmanlaşmış Soru-Cevap görevlerini verimli bir şekilde yerine getirme konusundaki çok yönlülüğü, onları finanstan sağlık hizmetlerine kadar çeşitli sektörlerde çekici kılmaktadır.
biz olarak Nisan ayında not edildiSLM’ler maliyet, enerji verimliliği ve özel uygulamalarda avantajlar sunarak “daha büyük her zaman daha iyidir” yaklaşımına meydan okumaya başlıyor. McQuade, Arcee’nin GPT-3 benzeri bir modeli 20.000 $ gibi düşük bir ücret karşılığında eğitebileceğini söylüyor.
“İş amaçlı kullanım durumları için bu kadar büyük çabalara gerek yok” diye açıkladı. SLM’lerin dağıtımı daha hızlıdır, daha kolay özelleştirilebilir ve daha küçük donanım kurulumlarında çalışabilir. SLM’ler ayrıca daha güvenli olabilir ve kendi uzmanlık alanlarında halüsinasyonlara daha az eğilimli olabilir.
Microsoft ve Google da SLM teknolojisini hızla geliştirerek yapay zekanın büyük ölçek gerektirdiği fikrine meydan okuyor. Microsoft’un Phi serisi, 2,7 milyar parametreli Phi-2 ve 14 milyara kadar parametre içeren Phi-3 ailesini içerir. Şubat 2024’te Google, tüketici donanımı için optimize edilmiş Gemma serisini piyasaya sürdü. Gemma iki değişken sunmaktadır: 2 milyar parametreli model ve 7 milyar parametreli versiyon. Her iki model de standart dizüstü ve masaüstü bilgisayarlarda çalışarak gelişmiş yapay zeka yeteneklerine erişimi genişletiyor.
Bu gelişmeler, ham gücün yanı sıra verimliliği ve erişilebilirliği vurgulayarak yapay zeka stratejisinde bir değişimin sinyalini veriyor. McQuade, “Model Birleştirme ve Spektrum’a yönelik büyük müşteri beğenisini ve SLM’lerimize yönelik genel talebi görüyoruz” dedi.
Arcee AI, bu rekabetçi ortama benzersiz bir yaklaşımla giriyor. Microsoft ve Google genel amaçlı SLM’lere odaklanırken Arcee, işletmelerin kendi SLM’lerini oluşturmaları için alana özel modeller ve araçlar konusunda uzmanlaşmıştır. McQuade, “Kuruluşların yüksek yatırım getirisi olan tek bir kullanım senaryosunun ötesine geçmesine olanak sağlıyoruz” diye açıkladı. “Verimliliğimiz sayesinde 10 veya 20 kullanım senaryosunun üstesinden gelebilirler.”
Bu strateji, aynı zamanda uçta da devreye alınabilecek uygun maliyetli, enerji açısından verimli yapay zeka çözümlerine yönelik artan taleple uyumludur. Arcee’nin Model Birleştirme ve Spektrum teknolojileri, hazır modellere göre daha fazla özelleştirmeye izin verirken bu faydaları sağlamayı amaçlamaktadır.
Arcee’nin çözümündeki önemli bir eğitim tekniği olan model birleştirme, birden fazla yapay zeka modelinin, boyutunu artırmadan tek ve daha yetenekli bir modelde birleştirilmesine olanak tanır. McQuade, “Model birleştirmeyi transfer öğreniminin bir sonraki biçimi olarak görüyoruz” diye açıkladı. Süreç, farklı modellerin katmanlarını birleştirmeyi ve her birinin en iyi yönlerini alarak bir hibrit oluşturmayı içerir.
Örneğin, iki adet 7 milyar parametreli model birleştirildiğinde sonuç, 14 milyar parametreli bir model değil, yine 7 milyar parametreli bir model olur. McQuade, “Her modelin katmanlarının en iyi parçalarını alıp bunları bir araya getiriyorsunuz” dedi. Bu teknik, Arcee’nin, daha küçük bir modelin verimliliğini ve daha düşük hesaplama gereksinimlerini korurken birden fazla özel modelin güçlü yönlerine sahip modeller oluşturmasına olanak tanır.
Şirketin yaklaşımı, kullanıcıların her giriş modelinden ne kadar alındığını kontrol ederek füzyonun ağırlığını ve yoğunluğunu ayarlamasına olanak tanıyor. Bu esneklik, belirli alanlardaki daha büyük, daha genel modellerden daha iyi performans gösterebilecek, son derece özel modellerin oluşturulmasına olanak tanır.
Arcee’s Spectrum, dil modeli eğitiminin verimliliğinde önemli bir ilerlemeyi temsil ediyor. Bu teknik, sinyal-gürültü oranına (SNR) dayalı olarak model içindeki belirli katman modüllerini hedeflerken diğerlerini dondurur. Arcee AI Araştırma Mühendisi Lucas Atkins şunları söyledi: “Spectrum, eğitim süresini %42’ye kadar optimize ediyor ve herhangi bir performans düşüşü olmadan felaketle sonuçlanan unutmayı azaltıyor.”
Spectrum’un önemi, model eğitimi için gereken kaynakları önemli ölçüde azaltma yeteneğinde yatmaktadır. Geleneksel yöntemler genellikle eğitim sırasında bir modelin tüm parametrelerinin güncellenmesini içerir; bu da hesaplama açısından pahalı ve zaman alıcı olabilir. Spectrum’un seçici yaklaşımı, hesaplama kaynaklarının daha verimli kullanılmasına olanak tanıyarak özel yapay zeka modelleri geliştirmek isteyen kuruluşların giriş engellerini potansiyel olarak azaltır.
Atkins, “Model kalitesinden ödün vermeden endüstri lideri eğitim hızı sunarak Spectrum’u eğitim hattımıza sıfırdan dahil ettik” diye ekledi. Bu verimlilik, işletmeler için daha hızlı yineleme ve daha uygun maliyetli model geliştirme olanağı sağlayabilir.
LLM’lerdeki performans kazanımları durağanlaşma belirtileri gösterdikçe, yapay zekanın geleceği giderek daha verimli, uzmanlaşmış modellerde yatabilir. McQuade şunları söyledi: “Artık yüksek yatırım getirisi olan tek bir kullanım durumu olmak zorunda değil. 10 kullanım senaryosu, 20 kullanım senaryosu yapabilirsiniz çünkü çok verimliyiz.” SLM’lere doğru bu geçiş, potansiyel olarak endüstriler genelinde yapay zeka erişimini demokratikleştirerek gelişmiş yapay zeka yeteneklerini daha erişilebilir hale getirebilir ve belirli iş ihtiyaçlarına göre uyarlanabilir.
McQuade şunu vurguladı: “Her şey yıllık bir sözleşmedir ve bu, bu alanda oldukça benzersizdir.” Fiyatlandırma modeli, yapay zeka hizmetlerinde yaygın olan geleneksel kullanıma dayalı fiyatlandırmadan uzaklaşarak yazılım lisanslamasına dayanmaktadır. McQuade bunu “yazılım lisansı” olarak tanımladı ve çıkarım için de ücret aldıklarını belirtti.
Arcee AI, teknolojisini iki ana ürün teklifiyle sunuyor:
Arcee’nin iki dağıtım yöntemi vardır:
McQuade, VPC seçeneğinin “gerçekten büyük şirketlerde yankı uyandırdığını” belirtti. Yıllık sözleşme modeli genişlemeye izin verir. McQuade’in belirttiği gibi, “Eğer yeni modeller falan istiyorsanız, o zaman sizi genişletiriz.” Ayrıca daha müdahalesiz bir yaklaşım isteyen müşteriler için ek destek ve yönetilen hizmetler de sunuyorlar.
Bu fiyatlandırma ve satış modeli, Arcee AI için istikrarlı, öngörülebilir bir gelir akışı sağlarken müşterilere sürekli değer sağlamak üzere tasarlanmıştır. McQuade, “Şu anda gelirimiz 2 milyon dolar seviyesinde ve 2025’in başlarında kârlı hale gelme şansımız yüksek” dedi. Şu anda 25 çalışana sahip olan şirket, 18 ay içinde sayının yaklaşık 50’ye çıkmasını planlıyor.
SLM’lerin gerçek gücü yalnızca etki alanlarına özgü olmalarında değil, aynı zamanda şirketlerin yapay zekayı sürekli olarak denemelerine, öğrenmelerine ve optimize etmelerine olanak sağlamasında da yatmaktadır. Modelleri daha düşük bir maliyetle hızla yineleme ve geliştirme yeteneği, yapay zekanın başarılı bir şekilde benimsenmesinde belirleyici faktör olabilir.
Yapay zeka gelişimi, şirketlerin yapay zeka modellerini gelişen ve uyum sağlayan canlı sistemler olarak ele almasıyla daha yinelemeli, deneysel bir sürece benzemeye başlayabilir. Çeviklik yakında model performansı kadar önemli hale gelebilir. Bu, çevik metodolojilerin ve sürekli entegrasyon/sürekli dağıtım (CI/CD) uygulamalarının artık standart hale geldiği yazılım geliştirmenin evrimini yansıtıyor.
Daha hızlı bir yineleme döngüsü gerçek rekabet avantajları yaratır. SLM’leri kullanan şirketler, gerçek dünyadan gelen geri bildirimlere dayalı modelleri geliştirerek değişen kullanıcı ihtiyaçlarına hızla uyum sağlayabilir. Şirketler, tüm kaynakları yüksek riskli tek bir yapay zeka uygulamasına koymak yerine, aynı anda birden fazla kullanım senaryosunu keşfedebilir ve bütçelerini zorlamadan işleri için en etkili uygulamaları belirleyebilir.
Arcee, hızla yinelenebilen ve özelleştirilebilen verimli, alana özgü küçük dil modelleri vizyonunu sunmada başarılı olursa, yapay zeka gelişiminde çevikliğin kritik hale geldiği doğru zamanda iyi bir şekilde konumlandırılabilir. Bu, şirketi son derece değerli bir kuruluşa dönüştürebilir. Önümüzdeki aylar, küçük dil modellerinin rekabetçi yapay zeka ortamında gerçekten bir üstünlüğe sahip olup olmadığını ortaya çıkaracak ve potansiyel olarak sektörün model geliştirme ve konuşlandırma yaklaşımını yeniden şekillendirecek.
Web sitemizde ziyaretçilerimize daha iyi hizmet sağlayabilmek adına bazı çerezler kullanıyoruz. Web sitemizi kullanmaya devam ederseniz çerezleri kabul etmiş sayılırsınız.
Gizlilik Politikası