OpenAI rakibi Anthropic, Claude 3.5 Sonnet adında güçlü, yeni ve üretken bir yapay zeka modeli piyasaya sürüyor. Ancak bu, ileriye doğru anıtsal bir sıçramadan ziyade giderek artan bir adımdır.
Claude 3.5 Sonnet, hem metni hem de görüntüleri analiz edebilmenin yanı sıra metin üretebilir ve Anthropic’in şimdiye kadarki en iyi performans gösteren modelidir – en azından kağıt üzerinde. Claude 3.5 Sonnet, okuma, kodlama, matematik ve görselleştirmeye yönelik çeşitli yapay zeka kriterlerinde, yerini aldığı model olan Claude 3 Sonnet’ten daha iyi performans gösteriyor. Ve Anthropic’in önceki amiral gemisi modeli Claude 3 Opus’u yener.
Karşılaştırmalar yapay zekanın ilerlemesinin en yararlı ölçüsü olmayabilir; bunun nedeni kısmen birçoğunun, sağlık sınavı sorularını yanıtlamak gibi ortalama bir insan için geçerli olmayan ezoterik uç durumları test etmesidir. Ama değeri ne olursa olsun, Claude 3.5 Sonnet zar zor OpenAI’nin yakın zamanda piyasaya sürülen GPT-4o’su da dahil olmak üzere, Anthropic’in test ettiği kriterlere göre en iyi rakip lider modeller.
Anthropic, yeni modelin yanı sıra, kullanıcıların Anthropic modelleri tarafından oluşturulan içeriği (örn. kod ve belgeler) düzenleyebileceği ve ekleyebileceği bir çalışma alanı olan Artifacts adını verdiği şeyi piyasaya sürüyor. Anthropic, şu anda ön izleme aşamasında olan Artifacts’in yakın gelecekte daha büyük ekiplerle işbirliği yapma ve bilgi tabanlarını depolama gibi yeni özellikler kazanacağını söylüyor.
Verimliliğe odaklanın
Claude 3.5 Sonnet, Claude 3 Opus’tan biraz daha performanslı ve Anthropic, modelin mizah gibi kavramların yanı sıra incelikli ve karmaşık talimatları daha iyi anladığını söylüyor. (Yine de yapay zekanın hiç de komik olmadığı biliniyor.) Ancak belki de daha önemlisi, Claude ile hızlı yanıt gerektiren uygulamalar (örneğin, müşteri hizmetleri sohbet robotları) geliştiren geliştiriciler için 3.5 Sonnet daha hızlıdır. Anthropic, 3 Opus’un yaklaşık iki katı hıza sahip olduğunu iddia ediyor.
Anthropic’e göre, Claude 3.5 Sonnet’in 3 Opus’tan daha fazla geliştiği alanlardan biri de vizyon (fotoğrafların analizi). 3.5 Sonnet, tabloları ve grafikleri daha doğru bir şekilde yorumlayabilir ve çarpık ve görsel kusurlu resimler gibi “kusurlu” görüntülerden metinleri yazıya geçirebilir.
Anthropic’in ürün lideri Michael Gerstenhaber, iyileştirmelerin mimari ayarlamaların ve yapay zeka tarafından oluşturulan veriler de dahil olmak üzere yeni eğitim verilerinin sonucu olduğunu söylüyor. Özellikle hangi veriler? Gerstenhaber açıklama yapmadı ancak Claude 3.5 Sonnet’in gücünün büyük kısmını bu eğitim setlerinden aldığını ima etti.
“Ne önemli [businesses] Gerstenhaber, TechCrunch’a yaptığı açıklamada, yapay zekanın iş ihtiyaçlarını karşılamalarına yardımcı olup olmadığı, yapay zekanın bir kıyaslamada rekabetçi olup olmadığı değil, dedi. “Ve bu perspektiften bakıldığında, Claude 3.5 Sonnet’in elimizdeki diğer her şeyden ve aynı zamanda sektördeki diğer her şeyin ilerisinde bir adım işlevi olacağına inanıyorum.”
Eğitim verilerinin gizliliği rekabetçi nedenlerden kaynaklanıyor olabilir. Ancak bu aynı zamanda Anthropic’i yasal zorluklardan, özellikle de adil kullanımla ilgili zorluklardan korumak da olabilir. Mahkemeler, Anthropic gibi satıcıların ve OpenAI, Google, Amazon ve benzeri rakiplerinin, telif hakkıyla korunan veriler de dahil olmak üzere kamuya açık veriler üzerinde, bu verileri oluşturanlara tazminat ödemeden veya kredi vermeden eğitim verme hakkına sahip olup olmadığına henüz karar vermedi.
Yani tek bildiğimiz, Claude 3.5 Sonnet’in, Anthropic’in önceki modelleri gibi çok sayıda metin ve görsel üzerine eğitilmiş olduğu ve ayrıca modeli kullanıcıların niyetleriyle “uyumlu hale getirmeye” çalışmak için insan test uzmanlarından alınan geri bildirimler üzerine eğitilmiş olduğu ve bu sayede toksik veya başka herhangi bir şekilde fışkırmasını önleyeceği umuluyor. sorunlu metin.
Başka ne biliyoruz? Claude 3.5 Sonnet’in bağlam penceresi (modelin yeni metin oluşturmadan önce analiz edebileceği metin miktarı) 200.000 jetondur, yani 3 Sonnet ile aynıdır. Jetonlar, “fantastik” kelimesindeki “fan”, “tas” ve “tic” heceleri gibi alt bölümlere ayrılmış ham veri parçalarıdır; 200.000 jeton yaklaşık 150.000 kelimeye eşdeğerdir.
Ve Claude 3.5 Sonnet’in bugün mevcut olduğunu biliyoruz. Anthropic’in web istemcisinin ve Claude iOS uygulamasının ücretsiz kullanıcıları, buna ücretsiz olarak erişebilir; Anthropic’in ücretli planlarına abone olan Claude Pro ve Claude Team, 5 kat daha yüksek oran limitlerine sahip oluyor. 3.5 Sonnet ayrıca Anthropic’in API’sinde ve Amazon Bedrock ve Google Cloud’un Vertex AI gibi yönetilen platformlarında da yayında.
Gerstenhaber, “Claude 3.5 Sonnet gerçekten hızdan ödün vermeden zekada atılmış bir adımdır ve bizi tüm Claude model ailesi boyunca gelecekteki sürümler için hazırlıyor” dedi.
Claude 3.5 Sonnet ayrıca, kullanıcı modelden kod parçacıkları, metin belgeleri veya web sitesi tasarımları gibi içerik oluşturmasını istediğinde Claude web istemcisinde özel bir pencere açan Artifacts’i de yönetiyor. Gerstenhaber şöyle açıklıyor: “Yapılar, oluşturulan içeriği bir kenara koyan ve kullanıcı olarak bu içerik üzerinde yineleme yapmanıza olanak tanıyan model çıktılarıdır. Diyelim ki kod oluşturmak istiyorsunuz; yapı kullanıcı arayüzüne yerleştirilecek ve ardından Claude ile konuşabilir ve belgeyi geliştirerek kodu çalıştırabilmeniz için belge üzerinde yinelemeler yapabilirsiniz.”
Daha büyük resim
Peki Claude 3.5 Sonnet’in daha geniş Antropik ve yapay zeka ekosistemi bağlamında önemi nedir?
Claude 3.5 Sonnet, büyük bir araştırma atılımı dışında, artan ilerlemenin şu anda model cephesinde bekleyebileceğimiz ölçüde olduğunu gösteriyor. Geçtiğimiz birkaç ayda Google’ın (Gemini 1.5 Pro) ve OpenAI’nin (GPT-4o) kıyaslama ve niteliksel performans açısından ibreyi marjinal bir şekilde hareket ettiren amiral gemisi sürümlerine tanık olduk. Ancak günümüzün model mimarilerinin katılığı ve eğitilmeleri için gereken muazzam bilgi işlem kapasitesi nedeniyle, uzun süredir GPT-3’ten GPT-4’e geçişe eşdeğer bir sıçrama olmadı.
Üretken yapay zeka tedarikçileri, gelecek vaat eden yeni ölçeklenebilir mimariler yerine dikkatlerini veri iyileştirme ve lisanslamaya çevirdikçe, yatırımcıların üretken yapay zeka için yatırım getirisine giden beklenenden daha uzun bir yola karşı temkinli olmaya başladığına dair işaretler var. Antropik, Amazon’un (ve daha az ölçüde Google’ın) OpenAI’ye karşı sigortası açısından kıskanılacak bir konumda olduğundan bu baskıdan bir şekilde aşılanmıştır. Ancak şirketin 2024 sonuna kadar 1 milyar doların biraz altına ulaşacağı tahmin edilen geliri, OpenAI’nin çok küçük bir kısmı ve eminim ki Anthropic’in destekçileri bu gerçeği unutmasına izin vermeyecektir.
Bridgewater, Brave, Slack ve DuckDuckGo gibi ev markalarını içeren büyüyen bir müşteri tabanına rağmen Anthropic’in hâlâ belirli bir kurumsal kalite anlayışı yok. PwC’nin kısa süre önce şirkete üretken yapay zeka tekliflerini yeniden satmak için ortaklık kurduğu kişinin Antropik değil OpenAI olması dikkat çekicidir.
Dolayısıyla Anthropic, emtia fiyatlarında biraz daha iyi performans sunmak için Claude 3.5 Sonnet gibi ürünlere geliştirme süresi ayırarak ilerleme kaydetme konusunda stratejik ve köklü bir yaklaşım benimsiyor. 3,5 Sonnet, 3 Sonnet ile aynı fiyattadır: modele beslenen milyon jeton başına 3 ABD doları ve model tarafından üretilen milyon jeton başına 15 ABD doları.
Gerstenhaber sohbetimizde bundan bahsetti. “Bir uygulama geliştirirken, son kullanıcının hangi modelin kullanıldığını veya bir mühendisin kendi deneyimi için nasıl optimize ettiğini bilmesi gerekmemelidir” dedi ve şöyle devam etti: “ancak mühendis bu deneyimi optimize edecek araçlara sahip olabilir Optimize edilmesi gereken vektörler arasında yer alıyor ve maliyet de kesinlikle bunlardan biri.”
Claude 3.5 Sonnet halüsinasyon sorununu çözmüyor. Neredeyse kesinlikle hata yapar. Ancak geliştiricilerin ve işletmelerin Anthropic platformuna geçmesini sağlayacak kadar çekici olabilir. Ve günün sonunda Antropik için önemli olan da budur.
Aynı amaca doğru Anthropic, geliştiricilerin modellerinin dahili özelliklerini “yönlendirmesine” olanak tanıyan deneysel yönlendirme yapay zekası gibi araçları iki katına çıkardı; modellerinin uygulamalar içinde işlem yapmasına olanak tanıyan entegrasyonlar; ve üretilen araçlar üstte yukarıda bahsedilen Artifacts deneyimi gibi modellerinden. Ayrıca ürün sorumlusu olarak bir Instagram kurucu ortağı da işe alındı. Ve ürünlerinin bulunabilirliğini genişletti; en son Claude’u Avrupa’ya getirdi ve Londra ve Dublin’de ofisler kurdu.
Antropik, modeller arasındaki yetenek farkı daraldıkça müşterileri elde tutmanın anahtarının (yalnızca yalıtılmış modeller değil) modeller etrafında bir ekosistem oluşturmanın olduğu fikrine varmış görünüyor.
Yine de Gerstenhaber, web araması ve tercihleri hatırlama yeteneği gibi özelliklerle Claude 3.5 Opus gibi daha büyük ve daha iyi modellerin ufukta olduğu konusunda ısrar etti.
“Derin öğrenmenin henüz duvara çarptığını görmedim ve duvar hakkında spekülasyon yapmayı araştırmacılara bırakıyorum, ancak özellikle de ilerleme hızına baktığınızda bu konuda bir sonuca varmak için biraz erken olduğunu düşünüyorum. Yenilikçilik” dedi. “Çok hızlı bir gelişme ve çok hızlı bir yenilik var ve bunun yavaşlayacağına inanmak için hiçbir nedenim yok.”
Göreceğiz.
Kaynak: https://techcrunch.com/2024/06/20/anthropic-claims-its-latest-model-is-best-in-class/