Endüstri lideri AI kapsamındaki en son güncellemeler ve özel içerik için günlük ve haftalık bültenlerimize katılın. Daha fazla bilgi edin
Daha önce net olmasaydı, şimdi kesinlikle çok açık: açık kaynak gerçekten AI için önemli. Başarısı Deepseek-R1 Açık kaynaklı AI için bir ihtiyaç ve talep olduğunu kanıtlamıştır.
Ancak açık kaynaklı yapay zeka tam olarak nedir? Meta ve onun Lama Modeller, bazı koşullarla modeli kullanmak için ücretsiz erişim anlamına gelir. Deepseek, model kodu açık ve herkesin kullanabileceği model kodu ile izin verilen bir açık kaynak lisansı altında mevcuttur. Bununla birlikte, hiçbir yaklaşımın mümkün olmadığı şey, ağırlıklar ve eğitim verileri de dahil olmak üzere tüm model kodlarına tam koşulsuz erişimdir. Tüm bu bilgiler olmadan, geliştiriciler hala açık modelle çalışabilir, ancak gerçekten nasıl çalıştığını ve daha da önemlisi tamamen yeni bir model oluşturulacağını anlamak için gerekli tüm araçlara ve bilgilere sahip değildirler. Bu, eski Google ve Apple AI gazileri tarafından yönetilen yeni bir girişimin çözmeyi amaçladığı bir zorluk.
Bugün lansman, OUMI Princeton, Stanford, MIT, UC Berkeley, Oxford Üniversitesi, Cambridge Üniversitesi, Waterloo Üniversitesi ve Carnegie Mellon gibi 13 önde gelen araştırma üniversitesinden oluşan bir ittifakla desteklenmektedir. OUMI’nin kurucuları, ihtiyaçlarını karşıladığını söyledikleri mütevazı bir tohum turu olan 10 milyon dolar topladı. Openai gibi büyük oyuncular, büyük veri merkezlerine 500 milyar dolarlık yatırımları düşünürken StargateOUMI radikal olarak farklı bir yaklaşım benimsiyor. Platform, araştırmacılara ve geliştiricilere temel modelleri oluşturmak, değerlendirmek ve dağıtmak için eksiksiz bir araç seti sağlar.
OUMI kurucu ortağı ve daha önce Apple’da bir makine öğrenme mühendisi Oussama Elachqar, VentureBeat’e verdiği demeçte, “En büyük şirketler bile bunu kendi başlarına yapamıyor,” dedi. “Elma içindeki silolarda etkili bir şekilde çalışıyorduk ve sektörde başka birçok silo var. Bu modelleri işbirliği içinde geliştirmenin daha iyi bir yolu olmalı. ”
Deepseek ve Lama gibi açık kaynaklı modeller eksik
OUMI CEO’su ve eski Google Cloud AI Kıdemli Mühendislik Müdürü Manos Koukoumidis, VentureBeat’e araştırmacıların sürekli olarak AI deneylerinin son derece karmaşık olduğunu söylediklerini söyledi.
Bugünün açık modelleri bir adım ileri olsa da, yeterli değil. Koukoumidis, Deepseek-R1 ve Lama gibi mevcut “açık” AI modelleriyle, bir organizasyonun modeli kullanabileceğini ve kendi başlarına dağıtabileceğini açıkladı. Eksik olan, modelin üzerine inşa etmek isteyen herkesin tam olarak nasıl inşa edildiğini bilmemesidir.
OUMI kurucuları, bu şeffaflık eksikliğinin işbirlikçi AI araştırma ve geliştirmesinde önemli bir engel olduğuna inanıyorlar. Lama gibi bir proje bile, araştırmacılardan işin nasıl çoğaltılacağını ve üzerine inşa edileceğini anlamaları için önemli miktarda çaba gerektirir.
OUMI, kurumsal kullanıcılar, araştırmacılar ve diğer herkes için yapay zeka açmak için nasıl çalışır?
OUMI platformu, AI modelleri oluşturmada yer alan karmaşık iş akışlarını kolaylaştıran hepsi bir arada bir ortam sağlayarak çalışır.
Koukoumidis, bir temel modeli oluşturmak için, genellikle paralel olarak yapılması gereken 10 veya daha fazla adım olduğunu açıkladı. OUMI, gerekli tüm araçları ve iş akışlarını birleşik bir ortama entegre ederek araştırmacıların bir araya gelmesi ve çeşitli açık kaynaklı bileşenleri yapılandırması ihtiyacını ortadan kaldırır.
Temel teknik özellikler şunları içerir:
- 10m ila 405B parametreleri arasında değişen modeller için destek
- SFT, Lora, Qlora ve DPO dahil olmak üzere gelişmiş eğitim tekniklerinin uygulanması
- Hem metin hem de multimodal modellerle uyumluluk
- LLM hakemlerini kullanarak veri sentezi ve kürasyon eğitimi için yerleşik araçlar
- VLLM ve Sglang gibi modern çıkarım motorları aracılığıyla dağıtım seçenekleri
- Standart endüstri ölçütlerinde kapsamlı model değerlendirmesi
Koukoumidis, “Neleri birleştirebileceğinizi ve neyin iyi çalıştığını anlamanın açık kaynaklı gelişim cehennemiyle uğraşmak zorunda değiliz” diye açıkladı.
Platform, kullanıcıların ilk deneyler ve model eğitimi için kendi dizüstü bilgisayarlarını kullanarak küçük başlatmalarını sağlar. Kullanıcılar ilerledikçe, aynı OUMI ortamında üniversite kümeleri veya bulut sağlayıcıları gibi daha büyük hesaplama kaynaklarına kadar ölçeklenebilirler.
Açık bir model oluşturmak için büyük eğitim altyapısına ihtiyacınız yok
Deepseek-R1 ile ilgili büyük sürprizlerden biri, görünüşe göre Meta veya Openai’nin modellerini oluşturmak için kullandığı kaynakların bir kısmı ile inşa edilmesidir.
Openai ve diğerleri merkezi altyapıya milyarlarca yatırım yaparken OUMI, maliyetleri önemli ölçüde azaltabilecek dağıtılmış bir yaklaşıma bahis oynuyor.
“Yüz milyarlara ihtiyacınız olduğu fikri [of dollars] AI altyapısı temelde kusurludur ”dedi. “Üniversiteler ve araştırma kurumları arasında dağıtılmış bilgi işlem ile maliyetin bir kısmında benzer veya daha iyi sonuçlar elde edebiliriz.”
OUMI için ilk odak noktası, kullanıcıların ve geliştirmenin açık kaynaklı ekosistemini oluşturmaktır. Ancak şirketin planladığı tek şey bu değil. OUMI, işletmelerin bu modelleri üretim ortamlarında dağıtmasına yardımcı olmak için kurumsal teklifler geliştirmeyi planlıyor.
Kaynak: https://venturebeat.com/ai/ex-google-apple-engineers-launch-unconditionally-open-source-oumi-ai-platform-that-could-help-to-build-the-next-deepseek/