Çok aracılı yapay zeka neden Yüksek Lisans’ların çözemediği karmaşıklıkların üstesinden geliyor?

Sektör lideri yapay zeka kapsamına ilişkin en son güncellemeler ve özel içerik için günlük ve haftalık bültenlerimize katılın. Daha fazla bilgi edin


ChatGPT’nin tanıtımı şunları getirdi: büyük dil modelleri (LLM’ler) hem teknoloji hem de teknoloji dışı endüstrilerde yaygın kullanıma sahiptir. Bu popülerlik öncelikle iki faktörden kaynaklanmaktadır:

  1. Bir bilgi deposu olarak Yüksek Lisans’lar: Yüksek Lisans’lar çok miktarda internet verisi üzerinde eğitilir ve düzenli aralıklarla güncellenir (yani GPT-3, GPT-3.5, GPT-4, GPT-4o ve diğerleri);
  1. Ortaya çıkan yetenekler: Yüksek Lisans’lar büyüdükçe sergilenirler yetenekler daha küçük modellerde bulunmaz.

Bu, zaten insan düzeyinde zekaya ulaştığımız anlamına mı geliyor? yapay genel zeka (AGI)? Gartner tanımlar Çok çeşitli görev ve alanlarda bilgiyi anlama, öğrenme ve uygulama yeteneğine sahip bir yapay zeka biçimi olarak AGI. AGI’ye giden yol uzundur ve önemli bir engel, LLM eğitiminin geçmiş dizilere dayalı olarak kelimeleri tahmin eden otomatik gerilemeli doğasıdır. Yapay zeka araştırmalarının öncülerinden biri olan Yann LeCun Yüksek Lisans derecelerinin oto-regresif doğaları nedeniyle doğru yanıtlardan uzaklaşabilirler. Sonuç olarak, Yüksek Lisans’ın çeşitli sınırlamaları vardır:

  • Sınırlı bilgi: Yüksek verilerle eğitilmiş olmalarına rağmen, Yüksek Lisanslar güncel dünya bilgisinden yoksundur.
  • Sınırlı akıl yürütme: LLM’lerin sınırlı akıl yürütme kapasitesi vardır. Subbarao Kambhampati’nin işaret ettiği gibi Yüksek Lisans’lar iyi bilgi toplayıcılardır ancak iyi mantık yürütenler değil.
  • Dinamiklik Yok: Yüksek Lisans’lar statiktir ve gerçek zamanlı bilgilere erişemez.

Yüksek Lisans’ın zorluklarının üstesinden gelmek için daha gelişmiş bir yaklaşıma ihtiyaç vardır. Ajanların hayati önem taşıdığı nokta burasıdır.

Kurtarmaya giden ajanlar

Kavramı yapay zekada akıllı ajan yirmi yıl boyunca gelişmiştir ve zamanla değişen uygulamalara sahiptir. Günümüzde acenteler yüksek lisans (LLM) bağlamında tartışılmaktadır. Basitçe söylemek gerekirse, bir temsilci LLM zorlukları için İsviçre Çakısı gibidir: Mantık yürütmede bize yardımcı olabilir, İnternetten güncel bilgi alma araçları sağlayabilir (LLM ile dinamiklik sorunlarını çözme) ve bir görevi bağımsız olarak başarabilir. Omurgası LLM olan bir aracı, resmi olarak araçları, hafızayı, akıl yürütmeyi (veya planlamayı) ve eylem bileşenlerini içerir.

Bir bileşenin bileşenleri Abeyefendi (İmaj Kredisi: Lilian Weng)

Yapay zeka aracılarının bileşenleri

  • Araçlar, temsilcilerin internetten, veritabanlarından veya API’lerden harici bilgilere erişmesine olanak tanıyarak gerekli verileri toplamalarına olanak tanır.
  • Bellek kısa veya uzun süreli olabilir. Aracılar, çeşitli kaynaklardan gelen sonuçları geçici olarak tutmak için karalama defteri belleğini kullanırken, sohbet geçmişi uzun süreli belleğe bir örnektir.
  • Reasoner, karmaşık görevleri etkin işleme için yönetilebilir alt görevlere bölerek temsilcilerin metodik olarak düşünmesine olanak tanır.
  • Eylemler: Aracılar, çevrelerine ve muhakemelerine dayalı eylemler gerçekleştirir, geri bildirim yoluyla görevleri yinelemeli olarak uyarlar ve çözerler. ReAct, yinelemeli olarak akıl yürütme ve eylem gerçekleştirmenin yaygın yöntemlerinden biridir.

Ajanlar ne konuda iyi?

Temsilciler, özellikle karmaşık görevlerde başarılı olurlar. rol yapma modu, LLM’lerin gelişmiş performansından yararlanır. Örneğin, bir blog yazarken, bir kişi araştırmaya odaklanırken diğeri yazmayı üstlenebilir; her biri bir sorunla uğraşır. spesifik alt hedef. Bu çok etmenli yaklaşım, birçok gerçek hayat problemine uygulanır.

Rol yapma, temsilcilerin daha büyük hedeflere ulaşmak için belirli görevlere odaklanmalarına yardımcı olur ve halüsinasyonları belirgin bir şekilde azaltır. parçaları tanımlamak rol, talimat ve bağlam gibi bir istemin. LLM performansı iyi yapılandırılmış istemlere bağlı olduğundan, çeşitli çerçeveler bu süreci resmileştirir. Böyle bir çerçeve, Mürettebat AIdaha sonra tartışacağımız gibi, rol oynamayı tanımlamaya yönelik yapılandırılmış bir yaklaşım sağlar.

Çoklu ajanlar ve tek ajanlar

Tek bir aracı kullanarak artırılmış oluşturma (RAG) alma örneğini ele alalım. Bu, dizine eklenmiş belgelerdeki bilgilerden yararlanarak Yüksek Lisans Kurumlarının alana özgü sorguları ele almalarını sağlamanın etkili bir yoludur. Ancak tek ajan RAG’ın kendi sınırlamaları vardıralma performansı veya belge sıralaması gibi. Çoklu aracılı RAG, belgeyi anlama, alma ve sıralama için özel aracılar kullanarak bu sınırlamaların üstesinden gelir.

Çok aracılı bir senaryoda aracılar, dağıtılmış bilgi işlem modellerine benzer şekilde farklı şekillerde işbirliği yapar: sıralı, merkezi, merkezi olmayan veya paylaşılan mesaj havuzları. CrewAI, Autogen ve langGraph+langChain gibi çerçeveler, çoklu aracı yaklaşımlarıyla karmaşık problemlerin çözülmesine olanak tanır. Bu makalede, otonom iş akışı yönetimini keşfetmek için referans çerçevesi olarak CrewAI’yi kullandım.

İş akışı yönetimi: Çok aracılı sistemler için bir kullanım örneği

Endüstriyel süreçlerin çoğu, kredi işlemleri, pazarlama kampanyası yönetimi ve hatta DevOps gibi iş akışlarının yönetilmesiyle ilgilidir. Belirli bir hedefe ulaşmak için sıralı veya döngüsel adımlar gereklidir. Geleneksel bir yaklaşımda, her adım (örneğin, kredi başvurusu doğrulaması), bir insanın her başvuruyu manuel olarak işlemek ve bir sonraki adıma geçmeden önce bunları doğrulamak gibi sıkıcı ve sıradan bir görevi gerçekleştirmesini gerektirir.

Her adım, o alandaki bir uzmanın girdisini gerektirir. CrewAI kullanan çoklu temsilci kurulumunda her adım, birden fazla aracıdan oluşan bir ekip tarafından gerçekleştirilir. Örneğin, kredi başvurusu doğrulamasında, bir aracı, ehliyet gibi belgeler üzerindeki geçmiş kontrolleri yoluyla kullanıcının kimliğini doğrulayabilirken, diğer bir aracı, kullanıcının mali ayrıntılarını doğrulayabilir.

Bu durum şu soruyu gündeme getiriyor: Tek bir ekip (sıralı veya hiyerarşik olarak birden fazla temsilciden oluşan) tüm kredi işleme adımlarını gerçekleştirebilir mi? Mümkün olsa da mürettebatı karmaşık hale getirir, kapsamlı bir geçici hafıza gerektirir ve hedeften sapma ve halüsinasyon riskini artırır. Daha etkili bir yaklaşım, her bir kredi işleme adımını ayrı bir ekip olarak ele almak, tüm iş akışını sıralı veya döngüsel olarak çalışan ekip düğümlerinin (langGraph gibi araçları kullanarak) bir grafiği olarak görüntülemektir.

Yüksek Lisans’lar henüz zekanın ilk aşamalarında olduğundan, tam iş akışı yönetimi tamamen özerk olamaz. Son kullanıcı doğrulaması için kilit aşamalarda döngüdeki insana ihtiyaç vardır. Örneğin, mürettebat kredi başvurusu doğrulama adımını tamamladıktan sonra, sonuçların doğrulanması için insan gözetimi gereklidir. Zamanla yapay zekaya olan güven arttıkça bazı adımlar tamamen özerk hale gelebilir. Şu anda yapay zeka tabanlı iş akışı yönetimi, sıkıcı görevleri kolaylaştıran ve genel işlem süresini kısaltan yardımcı bir rol üstleniyor.

Üretim zorlukları

Çok aracılı çözümlerin üretime getirilmesi çeşitli zorluklara yol açabilir.

  • Ölçek: Temsilci sayısı arttıkça işbirliği ve yönetim zorlaşır. Çeşitli çerçeveler ölçeklenebilir çözümler sunar; örneğin, Llamaindex olay odaklı iş akışını alıyor Çoklu aracıları geniş ölçekte yönetmek için.
  • Gecikme: Görevler yinelemeli olarak yürütüldüğünden ve birden fazla LLM çağrısı gerektirdiğinden, aracı performansı sıklıkla gecikmeye neden olur. Yönetilen LLM’ler (GPT-4o gibi), örtülü korkuluklar ve ağ gecikmeleri nedeniyle yavaştır. Kendi kendine barındırılan LLM’ler (GPU kontrollü) gecikme sorunlarını çözmede kullanışlıdır.
  • Performans ve halüsinasyon sorunları: LLM’nin olasılıksal doğası nedeniyle, temsilci performansı her yürütmeye göre değişebilir. Çıktı şablonlaması (örneğin, JSON formatı) ve istemlerde bol miktarda örnek sağlamak gibi teknikler yanıt değişkenliğini azaltmaya yardımcı olabilir. Halüsinasyon sorunu daha da azaltılabilir eğitim acenteleri tarafından.

Son düşünceler

Gibi Andrew Ng dikkat çekiyoracenteler yapay zekanın geleceğidir ve Yüksek Lisans’larla birlikte gelişmeye devam edecekler. Çok aracılı sistemler, çok modlu verilerin (metin, resim, video, ses) işlenmesinde ve giderek daha karmaşık hale gelen görevlerin üstesinden gelmede ilerleyecektir. YGZ ve tam otonom sistemler henüz ufukta görünse de, çoklu aracılar Yüksek Lisans ve AGI arasındaki mevcut uçurumu kapatacak.

Abhishek Gupta şirketinde baş veri bilimcidir Talentica Yazılımı.

Veri Karar Vericileri

VentureBeat topluluğuna hoş geldiniz!

DataDecisionMakers, veri çalışması yapan teknik kişiler de dahil olmak üzere uzmanların veriyle ilgili içgörüleri ve yenilikleri paylaşabileceği yerdir.

En son fikirleri ve güncel bilgileri, en iyi uygulamaları ve veri ile veri teknolojisinin geleceğini okumak istiyorsanız DataDecisionMakers’ta bize katılın.

Hatta düşünebilirsiniz bir makaleye katkıda bulunmak kendinin!

DataDecisionMakers’dan Daha Fazlasını Okuyun


Kaynak: https://venturebeat.com/ai/why-multi-agent-ai-conquers-complexities-llms-cant/