Anthropic, yeni modellerinin GPT-4’ü geçtiğini iddia ediyor

Yüz milyonlarca risk sermayesi (ve belki yakında yüz milyonlarca kişi daha) tarafından desteklenen AI girişimi Anthropic, bugün GenAI teknolojisi Claude’un en son sürümünü duyurdu. Şirket, performans açısından OpenAI’nin GPT-4’üne rakip olduğunu iddia ediyor.

Anthropic’in yeni GenAI’sı olarak adlandırılan Claude 3, bir model ailesidir – Claude 3 Haiku, Claude 3 Sonnet ve Claude 3 Opus, Opus en güçlüleridir. Antropik iddiaların yanı sıra, analiz ve tahminde “artan yetenekler” ve ayrıca GPT-4 (ancak GPT-4 Turbo değil) ve Google’ın Gemini 1.0 Ultra (ancak Gemini 1.5 Pro değil) gibi modellere kıyasla belirli kıyaslamalarda gelişmiş performans sergiliyor.

Özellikle Claude 3, Anthropic’in ilk çok modlu GenAI’sidir; bu, GPT-4 ve Gemini’nin bazı özelliklerine benzer şekilde, görüntülerin yanı sıra metinleri de analiz edebildiği anlamına gelir. Claude 3 fotoğrafları, çizelgeleri, grafikleri ve teknik diyagramları işleyebilir, PDF’lerden, slayt gösterilerinden ve diğer belge türlerinden çizim yapabilir.

Bazı GenAI rakiplerinden bir adım daha iyi olan Claude 3, tek bir istekte birden fazla görüntüyü (maksimum 20’ye kadar) analiz edebilir. Anthropic, bunun görüntüleri karşılaştırmasına ve kontrast oluşturmasına olanak tanıdığını belirtiyor.

Ama Claude 3’ün görüntü işlemesinin sınırları var.

Antropik, modellerin insanları tanımlamasını engelledi; şüphesiz etik ve yasal sonuçlar konusunda ihtiyatlı davrandı. Şirket, Claude 3’ün “düşük kaliteli” görüntülerle (200 pikselin altında) hata yapmaya eğilimli olduğunu ve mekansal akıl yürütme (örn. analog saat kadranını okumak) ve nesne sayımı (Claude 3’ün kesin bilgi veremediği) içeren görevlerde zorluk yaşadığını kabul ediyor. görüntülerdeki nesnelerin sayısı).

Claude 3 de olmayacak oluşturmak sanat eseri. Modeller en azından şimdilik kesinlikle görüntü analizi yapıyor.

Anthropic, müşterilerin genel olarak Claude 3’ün çok adımlı talimatları daha iyi takip etmesini, JSON gibi formatlarda yapılandırılmış çıktılar üretmesini ve önceki sürümlere kıyasla İngilizce dışındaki dillerde sohbet etmesini bekleyebileceğini söylüyor. Anthropic, Claude 3’ün “taleplerin daha incelikli bir şekilde anlaşılması” sayesinde soruları daha az yanıtlamayı da reddetmesi gerektiğini söylüyor. Ve yakında Claude 3, kullanıcıların yanıtlarını doğrulayabilmeleri için sorulara yanıtlarının kaynağını belirtecek.

Anthropic bir destek makalesinde “Claude 3 daha etkileyici ve ilgi çekici yanıtlar üretme eğiliminde” diye yazıyor. “[It’s] Eski modellerimize kıyasla yönlendirmek ve yönlendirmek daha kolaydır. Kullanıcılar, daha kısa ve daha kısa yönlendirmelerle istenen sonuçlara ulaşabileceklerini görmeli.”

Bu iyileştirmelerden bazıları Claude 3’ün genişletilmiş bağlamından kaynaklanmaktadır.

Bir modelin bağlamı veya bağlam penceresi, modelin çıktıyı üretmeden önce dikkate aldığı girdi verilerini (örneğin metin) ifade eder. Küçük bağlam pencerelerine sahip modeller, en yeni konuşmaların içeriğini bile “unutmaya” eğilimlidir ve bu da onların konudan sapmasına yol açar – çoğu zaman sorunlu yollardan. Ek bir avantaj olarak, geniş bağlamlı modeller aldıkları verilerin anlatı akışını daha iyi kavrayabilir ve bağlamsal olarak daha zengin yanıtlar üretebilir (en azından varsayımsal olarak).

Anthropic, Claude 3’ün başlangıçta yaklaşık 150.000 kelimeye eşdeğer 200.000 jetonluk bir bağlam penceresini destekleyeceğini ve seçilmiş müşterilerin 1 milyon jetonluk bir bağlam penceresi (~ 700.000 kelime) açacağını söylüyor. Bu, Google’ın en yeni GenAI modeli olan ve aynı zamanda 1 milyona kadar bağlam penceresi sunan, yukarıda bahsedilen Gemini 1.5 Pro ile aynı seviyededir.

Şimdi, Claude 3’ün daha önce gelenlere göre bir yükseltme olması onun mükemmel olduğu anlamına gelmiyor.

Teknik incelemesinde Anthropic, Claude 3’ün diğer GenAI modellerini rahatsız eden önyargı ve halüsinasyonlar (yani uydurmalar) gibi sorunlardan muaf olmadığını itiraf ediyor. Bazı GenAI modellerinin aksine Claude 3 web’de arama yapamaz; modeller yalnızca Ağustos 2023 öncesine ait verileri kullanarak soruları yanıtlayabiliyor. Ayrıca Claude çok dilli olmasına rağmen bazı “düşük kaynaklı” dillerde İngilizce kadar akıcı değil.

Ancak Anthropic önümüzdeki aylarda Claude 3’e sık sık güncelleme sözü veriyor.

“Model zekasının sınırlarına yakın olduğuna inanmıyoruz ve [enhancements] önümüzdeki birkaç ay içinde Claude 3 model ailesine katılacak” diye yazıyor şirket bir blog yazısında.

Opus ve Sonnet artık web üzerinden ve Anthropic’in geliştirme konsolu ve API’si, Amazon’un Bedrock platformu ve Google’ın Vertex AI’sı aracılığıyla mevcut. Haiku bu yılın sonlarında onu takip edecek.

İşte fiyatlandırma dökümü:

  • Opus: Bir milyon giriş jetonu başına 15 ABD doları, bir milyon çıkış jetonu başına 75 ABD doları
  • Sonnet: Bir milyon giriş jetonu başına 3 ABD Doları, bir milyon çıkış jetonu başına 15 ABD Doları
  • Haiku: Bir milyon giriş jetonu başına 0,25 ABD doları, bir milyon çıkış jetonu başına 1,25 ABD doları

İşte bu Claude 3. Peki 30.000 fitlik manzara nedir?

Peki, bizim yaptığımız gibi rapor edildi Daha önce Anthropic’in hedefi “Yapay zekanın kendi kendine öğretmesi için yeni nesil bir algoritma” yaratmaktı. Böyle bir algoritma, e-postalara cevap verebilen, araştırma yapabilen, sanat eseri, kitap ve daha fazlasını üretebilen sanal asistanlar oluşturmak için kullanılabilir; bunlardan bazılarını zaten aşağıdakiler aracılığıyla deneyimledik: GPT-4 ve diğer büyük dil modelleri.

Anthropic, yukarıda bahsedilen blog yazısında buna dair ipuçları veriyor ve Claude 3’e, Claude 3’ün diğer sistemlerle etkileşime girmesine, etkileşimli kodlamaya ve “daha gelişmiş ajan yeteneklerine” izin vermek de dahil olmak üzere, kapı dışı yeteneklerini geliştiren özellikler eklemeyi planladığını söylüyor. .”

Bu son kısım, OpenAI’nin, verileri analiz için bir belgeden bir elektronik tabloya aktarmak veya gider raporlarını otomatik olarak doldurmak ve bunları muhasebe yazılımına girmek gibi karmaşık görevleri otomatikleştirmek için bir tür yazılım aracısı oluşturma yönündeki bildirilen hedeflerini akla getiriyor. OpenAI halihazırda geliştiricilerin uygulamalarına “aracı benzeri deneyimler” oluşturmalarına olanak tanıyan bir API sunuyor ve görünen o ki Anthropic, benzer işlevler sunmaya niyetli.

Bundan sonra Anthropic’ten bir görüntü üreteci görebilir miyiz? Açıkçası beni şaşırttı. Görüntü oluşturucular bugünlerde, esas olarak telif hakkı ve önyargıyla ilgili nedenlerden dolayı pek çok tartışmanın konusu. Google yakın zamanda, tarihsel bağlamı gülünç bir şekilde hiçe sayarak resimlere çeşitlilik kattıktan sonra resim oluşturucuyu devre dışı bırakmak zorunda kaldı ve bir dizi resim oluşturucu satıcısı, onları GenAI’yi bu konuda eğiterek çalışmalarından kâr elde etmekle suçlayan sanatçılarla yasal savaşlarda bulunuyor. kredi veya tazminat vermeden.

Anthropic’in GenAI eğitimi için kullandığı “anayasal yapay zeka” tekniğinin evrimini görmeyi merak ediyorum; şirket, modellerinin davranışını hem anlaşılmasını hem de gerektiğinde ayarlanmasını daha kolay hale getirdiğini iddia ediyor. Anayasal yapay zeka, modellerin sorulara yanıt vermesini ve basit bir dizi yol gösterici ilke kullanarak görevleri yerine getirmesini sağlayarak yapay zekayı insan niyetleriyle uyumlu hale getirmenin bir yolunu sağlamayı amaçlamaktadır. Örneğin, Claude 3 için Anthropic, modellerin engelli kişiler için anlaşılır ve erişilebilir olmasını sağlayan, müşteri geri bildirimlerinden yola çıkılarak oluşturulan anayasal bir ilke eklediğini söyledi.

Anthropic’in son oyunu ne olursa olsun, uzun vadede bu işin içinde. Geçen yılın mayıs ayında sızdırılan bir sunuma göre şirket, önümüzdeki yıl yaklaşık 5 milyar dolar toplamayı hedefliyor; bu, OpenAI ile rekabeti sürdürmek için gereken temel nokta olabilir. (Ne de olsa eğitim modelleri ucuz değil.) Google ve Amazon’un sırasıyla 2 milyar dolar ve 4 milyar dolarlık taahhütlü sermayesi ve taahhütleriyle yolunda gidiyor.

Kaynak: https://techcrunch.com/2024/03/04/anthropic-claims-its-new-models-beat-gpt-4/