Sektör lideri yapay zeka kapsamına ilişkin en son güncellemeler ve özel içerik için günlük ve haftalık bültenlerimize katılın. Daha fazla bilgi edin
Yapay zekanın akıl yürütme çağı oldukça iyi gidiyor.
OpenAI bir kez daha yapay zeka devrimini başlattıktan sonra o1 akıl yürütme modeli Eylül 2024’te tanıtıldı Soruları yanıtlamak daha uzun sürüyor ancak özellikle matematik ve bilimdeki karmaşık, çok adımlı problemlerde daha yüksek performansın getirisiyle ticari yapay zeka alanı taklitçiler ve rakiplerle dolup taşıyor.
var DeepSeek’in R1’i, Google Gemini 2 Flash Düşüncesive tam da bugün, LamaV-o1bunların tümü, modellerin birbiriyle etkileşime girmesini sağlayarak OpenAI’nin yeni o1 ve gelecek o3 model ailelerine benzer yerleşik “akıl yürütme” sunmayı amaçlıyor. “Düşünce zinciri” (CoT) uyarısı veya “kendi kendine harekete geçme”, kendilerini yolun ortasında analizleri üzerinde düşünmeye zorlama, geri dönme, kendi çalışmalarını kontrol etme ve en sonunda konuyu kafalarından atmak yerine daha iyi bir cevaba ulaşmaya zorlamak. gömmeler diğer büyük dil modellerinin (LLM’ler) yaptığı gibi mümkün olduğunca hızlı.
Ancak o1 ve o1-mini’nin yüksek maliyeti (15,00 ABD doları / 1 milyon giriş tokenı karşısında GPT-4o için 1,25 ABD doları / 1 milyon giriş tokenı) OpenAI’nin API’si) bazılarının sözde performans kazanımlarına karşı çıkmasına neden oldu. Gerçekten tipik, son teknolojiye sahip LLM’nin 12 katı kadar ödemeye değer mi?
Görünen o ki, dönüşüm geçirenlerin sayısı artıyor; ancak akıl yürütme modellerinin gerçek değerinin kilidini açmanın anahtarı, kullanıcının bunları farklı şekilde yönlendirmesinde yatıyor olabilir.
Shawn Wang’ın (AI haber servisinin kurucusu) Reçine) Alt yığın hafta sonu, eski Apple Inc., VisionOS Arayüz Tasarımcısı Ben Hylak’ın (Vision Pro uzamsal bilgi işlem kulaklığını güçlendiren) konuk gönderisi, Hylak’ın OpenAI’nin o1 modelini inanılmaz derecede değerli çıktılar almaya nasıl yönlendirdiğini ikna edici bir şekilde açıklayarak viral oldu (kendisi için) ).
Kısacası, o1 modeli için insan kullanıcı yazmak yerine, kullanıcının modelden ne çıktı almasını istediği, kullanıcının kim olduğu hakkında önceden birçok bağlam içeren “kısa bilgiler” veya daha ayrıntılı açıklamalar yazmayı düşünmelidirler. ve modelin kendileri için hangi formatta bilgi çıktısını istediklerini.
Hylak’ın yazdığı gibi Alt yığın:
Çoğu modelde, modelin bize nasıl yanıt vermesini istediğimizi söylemek üzere eğitildik. örneğin “Siz uzman bir yazılım mühendisisiniz. Yavaş + dikkatli düşün”
Bu, o1 ile bulduğum başarının tam tersi. Ona nasıl olduğu konusunda talimat vermiyorum – sadece ne olduğu konusunda talimat veriyorum. O zaman bırakın o1 işi devralsın ve kendi adımlarını planlayıp çözsün. Otonom akıl yürütmenin amacı budur ve aslında “döngüdeki insan” olarak manuel olarak gözden geçirip sohbet etmekten çok daha hızlı olabilir.
Hylak ayrıca, bir yürüyüş listesi için faydalı sonuçlar üreten o1 için örnek bir istemin harika, açıklamalı bir ekran görüntüsünü de içeriyor:
Bu blog yazısı o kadar faydalı oldu ki, OpenAI’nin kendi başkanı ve kurucu ortağı Greg Brockman bunu X hesabında mesaj: “o1 farklı bir model. Mükemmel performans, standart sohbet modellerine göre yeni bir şekilde kullanılmasını gerektiriyor.”
Akıcı İspanyolca konuşmayı öğrenmek için tekrarlanan arayışımda bunu kendim denedim ve işte sonuçmeraklılar için. Hylak’ın iyi yapılandırılmış yönlendirmesi ve tepkisi kadar etkileyici olmasa da kesinlikle güçlü bir potansiyel gösteriyor.
Ayrı olarak, Claude 3.5 Sonnet gibi mantık yürütmeyen LLM’ler söz konusu olduğunda bile, düzenli kullanıcıların daha iyi, daha az kısıtlı sonuçlar elde etmek için yönlendirmelerini geliştirmeleri için yer olabilir.
Eski Teton.ai mühendisi ve nöromodülasyon cihazı openFUS’un şu anki yaratıcısı Louis Arge olarak, X’e yazdı“keşfettiğim bir numara, LLM’lerin benim yönlendirmelerimden çok kendi yönlendirmelerine güvenmeleridir”, Claude’u ilk “tetikleme” ile “daha az korkak” olmaya nasıl ikna ettiğine dair bir örnek veriyor[ing] çıktıları konusunda onunla kavga etti.
Bunların hepsi, yapay zeka dönemi ilerledikçe hızlı mühendisliğin değerli bir beceri olmaya devam ettiğini gösteriyor.
Kaynak: https://venturebeat.com/ai/do-new-ai-reasoning-models-require-new-approaches-to-prompting/