Özel bir ağ oluşturma, içgörü ve sohbet gecesi için 27 Mart’ta Boston’daki liderlere katılın. Davet et Burada.
Bugün, Çekim AIDeepMind kurucu ortağı Mustafa Süleyman ve LinkedIn kurucu ortağı Reid Hoffman tarafından kurulan Palo Alto merkezli girişim, Inflection-2.5 adlı yeni bir temel modelini duyurdu.
Şu ana kadar yapılan çalışmalara dayanarak oluşturulan Inflection-2.5, şirketin orijinal Inflection-1’inden önemli ölçüde daha iyi performans gösteriyor ve özellikle STEM konularında OpenAI’nin GPT-4 modeliyle neredeyse eşleşiyor. Artık şirketin güç kaynağı Pi asistanıüstlenmek için tasarlandı ChatGPT ve Geminimobil ve web üzerinden test edilebilir.
Bu hamle, hızla gelişen yapay zeka alanında, insanlık için yapay zeka geliştirme yaklaşımını netleştirmeye devam eden OpenAI’nin hakimiyetini ele geçirme yönündeki en son çabayı işaret ediyor. Yakın zamanda Anthropic yayınlandı 3 Çalışmayı KapatGPT-4’ü yenen ilk model oldu.
Daha iyi performans gösteriyor ancak yine de GPT-4’ün gerisinde kalıyor
Inflection AI, başlangıcından bu yana, GPT serisi de dahil olmak üzere diğer modellere göre daha kişisel ve günlük konuşma dilinde hareket eden “empatili, kullanışlı ve güvenli” bir yapay zeka geliştiriyor. Şirket, Pi’nin arkasındaki modele imza niteliğinde bir kişilik ve olağanüstü bir EQ (duygusal bölüm) kazandırmak için benzersiz empatik ince ayar kullandı.
Yükseltilmiş Inflection 2.5’in piyasaya sürülmesiyle birlikte girişim, Haziran 2023’te 1,3 milyar dolar, fizik ve matematik gibi alanları kapsayan IQ yönünü geliştiriyor. İçinde Blog yazısı Bugün yayınlanan açıklamada şirket, Inflection 2.5 tarafından desteklenen Pi ile konuşan kullanıcıların bir hobiyi tartışmaktan kodlamaya, bir biyoloji makalesinin yanıtlarını kontrol etmekten bir iş planı taslağı hazırlamaya kadar çeşitli konuları tartışabileceğini söyledi.
Karşılaştırmalı değerlendirmelerdeki performans açısından, yükseltilmiş model, genel olarak Inflection 1’e göre önemli gelişmeler gösteriyor ve hala gecikmeli olmasına rağmen GPT-4’te kapanıyor.
Örneğin, liseden profesyonel düzeydeki zorluğa kadar çeşitli görevlerdeki performansı ölçen MMLU kıyaslamasında Inflection-2.5, 85.5 puan alarak GPT-4’ün 87.3’ünün hemen arkasında yer aldı. Benzer şekilde, STEM sınavlarında model neredeyse OpenAI modeli kadar iyi performans gösterdi ve GPT-4’ün 97. yüzdelik dilimine kıyasla Macar Matematik sınavında 63 (GPT4’te 68’e karşılık) ve Fizik GRE’de 85. yüzdelik puan aldı.
8,5 bin yüksek kaliteli ilkokul matematik probleminden oluşan GSM8K değerlendirmesinde Inflection modeli, GPT-4’ün 92’sine karşı 86,3 puan aldı. Kod oluşturma yeteneklerini değerlendirmek için tasarlanan 0 atışlı HumanEval’de GPT4’ün 79,3’üne karşılık 73,8 puan aldı.
Web aramasıyla verimli bir şekilde eğitilmiş bir model
Performans GPT 4’ten daha iyi olmasa da Inflection AI, bu “%94 GPT-4 düzeyindeki performansın” OpenAI büyük dil modeli (LLM) için yapılandan çok daha verimli bir eğitimle elde edildiğine dikkat çekti.
Şirkete göre Inflection-2.5, bu sonuçları elde etmek için GPT-4’ün eğitim FLOP’larının (hesaplama) yalnızca %40’ını aldı.
Ek olarak, tıpkı GPT-4 gibi model de gerçek zamanlı web arama özelliklerini bünyesinde barındırarak kullanıcılara güncel olaylar hakkında en güncel bilgileri sunuyor. Şirketin Pi asistanını herkes için bir yapay zeka olarak konumlandırdığı göz önüne alındığında, bu büyük bir yükseltme olacak. Ancak, hiçbir kıyaslama bunu kullanmadığından, web erişimiyle elde edilen sonuçların kalitesinin biraz farklı olabileceğini belirtmekte fayda var.
Inflection-2.5’e nasıl erişilir?
Inflection AI, Pi sohbet robotu için yeni modeli zaten piyasaya sürdü. Bu, asistanı kullanan herkesin yeteneklerini test etmeye başlayabileceği anlamına gelir.
Şirket, kullanıcıların yükseltilmiş modelden nasıl yararlandığını paylaşmadı ancak değişikliğin kullanıcı duyarlılığı, katılımı ve elde tutma üzerinde önemli bir etki yarattığını ve chatbot’un organik kullanıcı büyümesini hızlandırdığını söyledi.
Şu anda, mevcut olan Pi sohbet robotu Android, iOS, ağ ve olarak masaüstü Uygulamanın günlük bir milyon, aylık ise altı milyon aktif kullanıcısı bulunuyor. Yapay zeka ile ortalama 33 dakika süren dört milyardan fazla mesaj alışverişi yapıldı.
VentureBeat’in misyonu teknik karar vericilerin dönüştürücü kurumsal teknoloji hakkında bilgi edinmeleri ve işlem yapmaları için dijital bir şehir meydanı olmaktır. Brifinglerimizi keşfedin.
Kaynak: https://venturebeat.com/ai/inflection-ai-launches-new-model-for-pi-chatbot-nearly-matches-gpt-4/