Özel bir ağ oluşturma, içgörü ve sohbet gecesi için 27 Mart’ta Boston’daki liderlere katılın. Davet et Burada.

Bugün, Çekim AIDeepMind kurucu ortağı Mustafa Süleyman ve LinkedIn kurucu ortağı Reid Hoffman tarafından kurulan Palo Alto merkezli girişim, Inflection-2.5 adlı yeni bir temel modelini duyurdu.

Şu ana kadar yapılan çalışmalara dayanarak oluşturulan Inflection-2.5, şirketin orijinal Inflection-1’inden önemli ölçüde daha iyi performans gösteriyor ve özellikle STEM konularında OpenAI’nin GPT-4 modeliyle neredeyse eşleşiyor. Artık şirketin güç kaynağı Pi asistanıüstlenmek için tasarlandı ChatGPT ve Geminimobil ve web üzerinden test edilebilir.

Bu hamle, hızla gelişen yapay zeka alanında, insanlık için yapay zeka geliştirme yaklaşımını netleştirmeye devam eden OpenAI’nin hakimiyetini ele geçirme yönündeki en son çabayı işaret ediyor. Yakın zamanda Anthropic yayınlandı 3 Çalışmayı KapatGPT-4’ü yenen ilk model oldu.

Daha iyi performans gösteriyor ancak yine de GPT-4’ün gerisinde kalıyor

Inflection AI, başlangıcından bu yana, GPT serisi de dahil olmak üzere diğer modellere göre daha kişisel ve günlük konuşma dilinde hareket eden “empatili, kullanışlı ve güvenli” bir yapay zeka geliştiriyor. Şirket, Pi’nin arkasındaki modele imza niteliğinde bir kişilik ve olağanüstü bir EQ (duygusal bölüm) kazandırmak için benzersiz empatik ince ayar kullandı.

VB Etkinliği

Yapay Zeka Etki Turu – Boston

27 Mart’ta Boston’daki AI Etki Turunun bir sonraki durağı için heyecanlıyız. Microsoft ile ortaklaşa gerçekleştirilen bu özel, yalnızca davetle katılabileceğiniz etkinlikte, 2024 ve sonrasında veri bütünlüğüne yönelik en iyi uygulamalara ilişkin tartışmalar yer alacak. Kontenjan sınırlıdır, bu nedenle bugün bir davet isteyin.

Davet et

Yükseltilmiş Inflection 2.5’in piyasaya sürülmesiyle birlikte girişim, Haziran 2023’te 1,3 milyar dolar, fizik ve matematik gibi alanları kapsayan IQ yönünü geliştiriyor. İçinde Blog yazısı Bugün yayınlanan açıklamada şirket, Inflection 2.5 tarafından desteklenen Pi ile konuşan kullanıcıların bir hobiyi tartışmaktan kodlamaya, bir biyoloji makalesinin yanıtlarını kontrol etmekten bir iş planı taslağı hazırlamaya kadar çeşitli konuları tartışabileceğini söyledi.

Milyonlarca kullanıcı, milyarlarca mesaj. Yararlı IQ’nun dost canlısı EQ ile harmanlandığı yeni, yükseltilmiş Pi ile tanışın.
Artık birinci sınıf temel modelimiz tarafından desteklenmektedir: Inflection-2.5 https://t.co/bws0K9G7Hl
— Mustafa Suleyman (@mustafasuleyman) 7 Mart 2024

Karşılaştırmalı değerlendirmelerdeki performans açısından, yükseltilmiş model, genel olarak Inflection 1’e göre önemli gelişmeler gösteriyor ve hala gecikmeli olmasına rağmen GPT-4’te kapanıyor.

Örneğin, liseden profesyonel düzeydeki zorluğa kadar çeşitli görevlerdeki performansı ölçen MMLU kıyaslamasında Inflection-2.5, 85.5 puan alarak GPT-4’ün 87.3’ünün hemen arkasında yer aldı. Benzer şekilde, STEM sınavlarında model neredeyse OpenAI modeli kadar iyi performans gösterdi ve GPT-4’ün 97. yüzdelik dilimine kıyasla Macar Matematik sınavında 63 (GPT4’te 68’e karşılık) ve Fizik GRE’de 85. yüzdelik puan aldı.

8,5 bin yüksek kaliteli ilkokul matematik probleminden oluşan GSM8K değerlendirmesinde Inflection modeli, GPT-4’ün 92’sine karşı 86,3 puan aldı. Kod oluşturma yeteneklerini değerlendirmek için tasarlanan 0 atışlı HumanEval’de GPT4’ün 79,3’üne karşılık 73,8 puan aldı.

Web aramasıyla verimli bir şekilde eğitilmiş bir model

Performans GPT 4’ten daha iyi olmasa da Inflection AI, bu “%94 GPT-4 düzeyindeki performansın” OpenAI büyük dil modeli (LLM) için yapılandan çok daha verimli bir eğitimle elde edildiğine dikkat çekti.

Şirkete göre Inflection-2.5, bu sonuçları elde etmek için GPT-4’ün eğitim FLOP’larının (hesaplama) yalnızca %40’ını aldı.

Ek olarak, tıpkı GPT-4 gibi model de gerçek zamanlı web arama özelliklerini bünyesinde barındırarak kullanıcılara güncel olaylar hakkında en güncel bilgileri sunuyor. Şirketin Pi asistanını herkes için bir yapay zeka olarak konumlandırdığı göz önüne alındığında, bu büyük bir yükseltme olacak. Ancak, hiçbir kıyaslama bunu kullanmadığından, web erişimiyle elde edilen sonuçların kalitesinin biraz farklı olabileceğini belirtmekte fayda var.

Inflection-2.5’e nasıl erişilir?

Inflection AI, Pi sohbet robotu için yeni modeli zaten piyasaya sürdü. Bu, asistanı kullanan herkesin yeteneklerini test etmeye başlayabileceği anlamına gelir.

Şirket, kullanıcıların yükseltilmiş modelden nasıl yararlandığını paylaşmadı ancak değişikliğin kullanıcı duyarlılığı, katılımı ve elde tutma üzerinde önemli bir etki yarattığını ve chatbot’un organik kullanıcı büyümesini hızlandırdığını söyledi.

Şu anda, mevcut olan Pi sohbet robotu Android, iOS, ağ ve olarak masaüstü Uygulamanın günlük bir milyon, aylık ise altı milyon aktif kullanıcısı bulunuyor. Yapay zeka ile ortalama 33 dakika süren dört milyardan fazla mesaj alışverişi yapıldı.

VentureBeat’in misyonu teknik karar vericilerin dönüştürücü kurumsal teknoloji hakkında bilgi edinmeleri ve işlem yapmaları için dijital bir şehir meydanı olmaktır. Brifinglerimizi keşfedin.

Kaynak: https://venturebeat.com/ai/inflection-ai-launches-new-model-for-pi-chatbot-nearly-matches-gpt-4/

Daha iyi performans gösteriyor ancak yine de GPT-4’ün gerisinde kalıyor

VB Etkinliği

Web aramasıyla verimli bir şekilde eğitilmiş bir model

Inflection-2.5’e nasıl erişilir?

Instagram’da satış yapmaya nasıl başlanır?

WordPress site kurma rehberi: Görsel destekli tam kurulumu

Bilgisayarı hızlandırmak için RAM mi SSD mi?

Laptop bataryasının bozuk olduğunu bu şekilde anlayabilirsiniz

Trump, TikTok’u ‘bir süre’ ortalıkta tutmak istediğini söyledi

İstenmeyen sonuçlar: ABD seçim sonuçları dikkatsiz yapay zeka gelişiminin habercisi

OpenAI, güvenlik politikası hakkında ‘düşünmeleri’ için o1 ve o3’ü eğitti

Menü

Inflection AI, Pi sohbet robotu için neredeyse GPT-4 ile eşleşen yeni modeli piyasaya sürdü

Daha iyi performans gösteriyor ancak yine de GPT-4’ün gerisinde kalıyor

VB Etkinliği

Web aramasıyla verimli bir şekilde eğitilmiş bir model

Inflection-2.5’e nasıl erişilir?

İlgili haberler:

Instagram’da satış yapmaya nasıl başlanır?

WordPress site kurma rehberi: Görsel destekli tam kurulumu

Bilgisayarı hızlandırmak için RAM mi SSD mi?

Laptop bataryasının bozuk olduğunu bu şekilde anlayabilirsiniz

Trump, TikTok’u ‘bir süre’ ortalıkta tutmak istediğini söyledi

İstenmeyen sonuçlar: ABD seçim sonuçları dikkatsiz yapay zeka gelişiminin habercisi

OpenAI, güvenlik politikası hakkında ‘düşünmeleri’ için o1 ve o3’ü eğitti

Menü