Büyük teknoloji şirketinizin profilini yükseltmek isteseydiniz ve harcayacak 10 milyon dolarınız olsaydı, bunu nasıl harcardınız? Super Bowl reklamında mı? F1 sponsorluğu mu?
Sen abilir üretken bir yapay zeka modelinin eğitimi için harcayın. Geleneksel anlamda pazarlama olmasa da, üretken modeller dikkat çekicidir ve giderek satıcıların ekmek ve tereyağı ürün ve hizmetlerine yönlendirir.
OpenAI’nin GPT serisine ve Google’ın Gemini’sine benzer şekilde bugün duyurulan yeni bir üretken yapay zeka modeli olan Databricks’in DBRX’ine bakın. GitHub’da ve AI geliştirme platformu Hugging Face’te hem araştırma hem de ticari kullanım için mevcut olan DBRX’in temel (DBRX Base) ve ince ayarlı (DBRX Instruct) sürümleri, genel, özel veya başka şekilde özel veriler üzerinde çalıştırılabilir ve ayarlanabilir.
Databricks’in üretken yapay zekadan sorumlu başkan yardımcısı Naveen Rao, bir röportajda TechCrunch’a “DBRX yararlı olacak ve çok çeşitli konularda bilgi sağlayacak şekilde eğitildi” dedi. “DBRX, İngilizce dil kullanımına göre optimize edildi ve ayarlandı, ancak Fransızca, İspanyolca ve Almanca gibi çok çeşitli dillerde konuşma ve çeviri yapma kapasitesine sahip.”
Databricks, DBRX’i, Meta’nın Llama 2 ve AI startup’ı Mistral’ın modelleri gibi “açık kaynak” modellere benzer şekilde “açık kaynak” olarak tanımlıyor. (Bu modellerin gerçekten açık kaynak tanımını karşılayıp karşılamadığı ciddi bir tartışma konusudur.)
Databricks, DBRX’in eğitimi için yaklaşık 10 milyon dolar ve sekiz ay harcadığını söylüyor ve bunun (bir basın bülteninden alıntı yaparak) “daha iyi performans gösterdiğini” iddia ediyor[s] mevcut tüm açık kaynak modelleri standart kıyaslamalara göre.
Ancak – ve işte pazarlama sorunu – Databricks müşterisi olmadığınız sürece DBRX’i kullanmak son derece zordur.
Bunun nedeni, DBRX’i standart konfigürasyonda çalıştırmak için en az dört Nvidia H100 GPU’ya sahip bir sunucuya veya PC’ye ihtiyacınız olmasıdır. Tek bir H100’ün maliyeti binlerce dolara, muhtemelen daha da fazlasına mal oluyor. Bu, ortalama bir işletme için büyük bir değişiklik olabilir, ancak birçok geliştirici ve solo girişimci için ulaşılamayacak kadar uzaktır.
Ve önyüklenecek iyi bir baskı var. Databricks, 700 milyondan fazla aktif kullanıcıya sahip şirketlerin, Meta’nın Llama 2’ye yönelik kısıtlamalarına benzer “belirli kısıtlamalarla” karşılaşacağını ve tüm kullanıcıların, DBRX’i “sorumlu bir şekilde” kullanmalarını sağlayan şartları kabul etmesi gerektiğini söylüyor. (Databricks, yayınlanma tarihi itibariyle bu şartların ayrıntılarını gönüllü olarak sunmamıştı.)
Databricks, Mosaic AI Foundation Model ürününü bu engellere yönelik yönetilen çözüm olarak sunuyor; bu, DBRX ve diğer modelleri çalıştırmanın yanı sıra özel veriler üzerinde DBRX’te ince ayar yapmak için bir eğitim yığını sağlıyor. Rao, müşterilerin Databricks’in Model Hizmet teklifini kullanarak DBRX’i özel olarak barındırabileceğini veya DBRX’i kendi seçtikleri donanıma dağıtmak için Databricks ile çalışabileceğini önerdi.
Rao ekledi:
Databricks platformunu özelleştirilmiş model oluşturma için en iyi seçim haline getirmeye odaklandık; dolayısıyla sonuçta Databricks’in faydası, platformumuzda daha fazla kullanıcı olması olacaktır. DBRX, müşterilerin kendi modellerini sıfırdan oluşturmak için kullanabilecekleri, sınıfının en iyisi ön eğitim ve ayarlama platformumuzun bir gösterimidir. Bu, müşterilerin Databricks Mosaic AI üretken yapay zeka araçlarını kullanmaya başlamaları için kolay bir yoldur. Ve DBRX, kullanıma hazır olduğu haliyle son derece yeteneklidir ve büyük, kapalı modellere göre daha iyi bir ekonomiyle belirli görevlerde mükemmel performans sağlayacak şekilde ayarlanabilir.
Databricks, kısmen uzman karışımı (MoE) mimarisi sayesinde DBRX’in Llama 2’den 2 kata kadar daha hızlı çalıştığını iddia ediyor. DBRX’in Llama 2, Mistral’in yeni modelleri ve Google’ın yakın zamanda duyurduğu Gemini 1.5 Pro ile ortak noktasını paylaştığı MoE, temel olarak veri işleme görevlerini birden fazla alt göreve böler ve ardından bu alt görevleri daha küçük, uzmanlaşmış “uzman” modellere devreder.
Çoğu MEB modelinde sekiz uzman bulunmaktadır. DBRX’te 16 tane var ve Databricks bunun kaliteyi artırdığını söylüyor.
Ancak kalite görecelidir.
Databricks, DBRX’in belirli dil anlama, programlama, matematik ve mantık kriterlerinde Llama 2 ve Mistral modellerinden daha iyi performans gösterdiğini iddia ederken, DBRX, veritabanı programlama gibi niş kullanım durumlarının dışındaki çoğu alanda tartışmasız önde gelen üretken yapay zeka modeli olan OpenAI’nin GPT-4’ünün gerisinde kalıyor. dil nesli.
Rao, DBRX’in başka sınırlamaları da olduğunu, yani Databricks’in güvenlik testleri ve kırmızı ekip oluşturma çalışmalarına rağmen diğer tüm üretken yapay zeka modelleri gibi sorgulara verilen “halüsinasyonlu” yanıtların kurbanı olabileceğini kabul ediyor. Model, kelimeleri veya cümleleri belirli kavramlarla ilişkilendirmek üzere basitçe eğitildiğinden, bu ilişkiler tamamen doğru değilse yanıtları her zaman doğru olmayacaktır.
Ayrıca DBRX, Gemini dahil daha yeni amiral gemisi üretken yapay zeka modellerinin aksine multimodal değildir. (Görüntüleri değil, yalnızca metni işleyebilir ve oluşturabilir.) Ve onu eğitmek için hangi veri kaynaklarının kullanıldığını tam olarak bilmiyoruz; Rao yalnızca DBRX eğitiminde hiçbir Databricks müşteri verisinin kullanılmadığını açıkladı.
“DBRX’i çeşitli kaynaklardan gelen geniş bir veri kümesi üzerinde eğittik” diye ekledi. “Topluluğun bildiği, sevdiği ve her gün kullandığı açık veri kümelerini kullandık.”
Rao’ya, DBRX eğitim veri setlerinden herhangi birinin telif hakkıyla korunup korunmadığını veya lisanslı olup olmadığını ya da bariz önyargı belirtileri gösterip göstermediğini (örn. ırksal önyargılar) sordum, ancak doğrudan yanıt vermedi ve yalnızca şunu söyledi: “Kullanılan veriler konusunda dikkatli davrandık. ve modelin zayıf yönlerini iyileştirmek için kırmızı takım çalışmaları yürüttük.” Üretken yapay zeka modellerinin eğitim verilerini yeniden canlandırma eğilimi vardır; bu, lisanssız, telif hakkıyla korunan veya çok açık bir şekilde önyargılı verilerle eğitilen modellerin ticari kullanıcıları için büyük bir endişe kaynağıdır. En kötü senaryoda, bir kullanıcı farkında olmadan fikri mülkiyet haklarını ihlal eden veya bir modeldeki önyargılı çalışmayı projelerine dahil ettiği için etik ve yasal kancalara düşebilir.
Üretken yapay zeka modellerini eğiten ve yayınlayan bazı şirketler, olası ihlallerden kaynaklanan yasal ücretleri kapsayan politikalar sunmaktadır. Databricks şu anda bunu yapmıyor – Rao, şirketin bunu gerçekleştirebilecek “senaryoları keşfetmesi” gerektiğini söylüyor.
Bu ve DBRX’in hedefi kaçırdığı diğer yönler göz önüne alındığında, modelin mevcut veya potansiyel Databricks müşterileri dışında herkese satılması zor görünüyor. Databricks’in üretken yapay zekadaki OpenAI dahil rakipleri, çok rekabetçi fiyatlarda daha ilgi çekici olmasa da eşit teknolojiler sunuyor. Ve pek çok üretken yapay zeka modeli, yaygın olarak anlaşılan açık kaynak tanımına DBRX’ten daha yakın.
Rao, şirketin Mosaic Labs Ar-Ge ekibi (DBRX’in arkasındaki ekip) yeni üretken yapay zeka yollarını araştırırken Databricks’in DBRX’i geliştirmeye ve yeni sürümler yayınlamaya devam edeceğinin sözünü veriyor.
“DBRX, açık kaynak model alanını ileriye doğru itiyor ve gelecekteki modellerin daha verimli bir şekilde oluşturulmasına meydan okuyor” dedi. “Güvenilirlik, güvenlik ve önyargı açısından çıktı kalitesini iyileştirmeye yönelik teknikleri uyguladıkça varyantları piyasaya süreceğiz… Açık modeli, müşterilerimizin araçlarımızla özel yetenekler geliştirebilecekleri bir platform olarak görüyoruz.”
DBRX’in emsallerine göre şu anda nerede durduğuna bakılırsa, önünde olağanüstü derecede uzun bir yol var.
Kaynak: https://techcrunch.com/2024/03/27/databricks-spent-10m-on-a-generative-ai-model-that-still-cant-beat-gpt-4/
Web sitemizde ziyaretçilerimize daha iyi hizmet sağlayabilmek adına bazı çerezler kullanıyoruz. Web sitemizi kullanmaya devam ederseniz çerezleri kabul etmiş sayılırsınız.
Gizlilik Politikası