Senden duymak istiyoruz! Hızlı yapay zeka anketimize katılın ve yapay zekanın mevcut durumu, onu nasıl uyguladığınız ve gelecekte ne görmeyi beklediğiniz hakkındaki görüşlerinizi paylaşın. Daha fazla bilgi edin

Patronus AINew York merkezli bir girişim, açıldı Vaşak bugün, bir açık kaynak modeli Büyük dil modellerinde (LLM’ler) halüsinasyonları tespit etmek ve azaltmak için tasarlanmıştır. Bu atılım, farklı sektörlerdeki işletmelerin yapay zeka tarafından oluşturulan içeriğin güvenilirliğiyle boğuşması nedeniyle kurumsal yapay zekanın benimsenmesini yeniden şekillendirebilir.

Lynx, halüsinasyon tespit görevlerinde OpenAI’nin GPT-4’ü ve Anthropic’in Claude 3’ü gibi sektör devlerini geride bırakarak yapay zeka güvenilirliğinde önemli bir ilerlemeyi temsil ediyor. Patronus AI, Lynx’in tıbbi hataları tespit etmede GPT-4’ten %8,3 daha yüksek doğruluk elde ettiğini ve tüm görevlerde GPT-3,5’i %29 oranında aştığını bildirdi.

Patronus AI’nin Lynx modelinin (altta), OpenAI ve Anthropic’in rakip modellerinin kaçırdığı yanıttaki bir kusuru doğru bir şekilde tanımlamasıyla, bir botanik sorusuna verilen AI modeli yanıtlarının karşılaştırılması. (Kredi: Patronus AI)

Yapay zekanın hayal gücüyle mücadele: Lynx, LLM halüsinasyonlarını nasıl tespit edip düzeltiyor?

Patronus AI CEO’su Anand Kannappan, VentureBeat ile yaptığı röportajda bu gelişmenin önemini açıkladı. “Büyük dil modellerinde halüsinasyonlar, yapay zekanın yanlış veya yanıltıcı bilgiler üretmesi ve her şeyi gerçekmiş gibi uydurması durumunda ortaya çıkıyor” dedi. “İşletmeler için bu, yanlış karar almaya, yanlış bilgilendirmeye ve müşterilerde güven kaybına yol açabilir.”

Patronus AI da yayınlandı HaluBenchGerçek dünya senaryolarında yapay zeka modelinin doğruluğunu değerlendirmek için yeni bir referans noktası. Bu araç, doğruluğun çok önemli olduğu finans ve tıp alanlarındaki alana özgü görevleri içermesiyle öne çıkıyor.

VB Transform On-Demand’e erişmek için kaydolun

VB Transform 2024 için yüz yüze kartlar artık tükendi! Fırsatı kaçırmayın; konferanstan sonra sunulan özel isteğe bağlı erişim için şimdi kaydolun. Daha fazla bilgi edin

Kannappan, “Finans, sağlık hizmetleri, hukuk hizmetleri gibi hassas ve kesin bilgilerle uğraşan endüstriler ve sıkı veri doğruluğu gerektiren tüm sektörler Lynx’ten büyük fayda sağlayacak” dedi. “Halüsinasyonları tespit etme ve düzeltme yeteneği, kritik kararların doğru verilere dayanmasını sağlıyor.”

Açık Kaynak Yapay Zeka: Patronus Yapay Zeka’nın yaygın benimsenme ve para kazanma stratejisi

Açık kaynak kararı Vaşak Ve HaluBench endüstrilerde daha güvenilir yapay zeka sistemlerinin benimsenmesini hızlandırabilir. Ancak bu aynı zamanda Patronus AI’nın iş modeliyle ilgili soruları da gündeme getiriyor.

Kannappan bu endişeyi şöyle dile getirdi: “Ölçeklenebilir API erişimi, gelişmiş değerlendirme özellikleri ve iş akışları ve belirli iş ihtiyaçlarına göre uyarlanmış özel entegrasyonlar içeren kurumsal çözümlerimizle Lynx’ten para kazanmayı planlıyoruz.” Bu yaklaşım, açık kaynak temelleri üzerine kurulu birinci sınıf hizmetler sunan yapay zeka şirketlerinin daha geniş eğilimiyle uyumludur.

Lynx’in lansmanı yapay zeka gelişiminde kritik bir dönemeçte geliyor. İşletmeler çeşitli uygulamalar için giderek daha fazla Yüksek Lisans’a güveniyor ve bu da sağlam değerlendirme ve hata tespit araçlarına acil bir ihtiyaç yaratıyor. Patronus AI’nın yeniliği, AI sistemlerine güven oluşturmada önemli bir rol oynayabilir ve potansiyel olarak bunların kritik iş süreçlerine entegrasyonunu hızlandırabilir.

Yapay zeka güvenilirliğinin geleceği: Giderek otomatikleşen bir dünyada insan gözetimi

Ufukta zorluklar devam ediyor. Kannappan şunu belirtti: “Bir sonraki büyük zorluk, insanların yapay zeka çıktılarını etkili bir şekilde denetlemesine ve doğrulamasına olanak tanıyan ölçeklenebilir gözetim mekanizmaları geliştirmek olacak.” Bu, Lynx gibi araçlar otomatik değerlendirmenin sınırlarını zorlarken bile yapay zeka dağıtımında insan uzmanlığına olan ihtiyacın devam ettiğini vurguluyor.

Yapay zeka ortamı hızla geliştikçe, Patronus Yapay Zeka’nın katkısı, daha güvenilir ve güvenilir yapay zeka sistemlerine doğru önemli bir adıma işaret ediyor. Yapay zekanın benimsenmesinin karmaşık dünyasında yol alan kurumsal liderler için Lynx gibi araçların, riskleri azaltmada ve bu dönüştürücü teknolojinin potansiyelini en üst düzeye çıkarmada çok değerli olduğu kanıtlanabilir.

VB Günlük

Haberdar kalın! En son haberleri günlük olarak gelen kutunuza alın

Abone olarak VentureBeat’in şartlarını kabul etmiş olursunuz Kullanım Şartları.

Abone olduğun için teşekkürler. Daha fazlasına göz atın VB bültenleri burada.

Bir hata oluştu.

Kaynak: https://venturebeat.com/ai/meet-patronus-ais-lynx-the-open-source-bullshit-detector-outsmarting-gpt-4/

Yapay zekanın hayal gücüyle mücadele: Lynx, LLM halüsinasyonlarını nasıl tespit edip düzeltiyor?

Açık Kaynak Yapay Zeka: Patronus Yapay Zeka’nın yaygın benimsenme ve para kazanma stratejisi

Yapay zeka güvenilirliğinin geleceği: Giderek otomatikleşen bir dünyada insan gözetimi

Instagram’da satış yapmaya nasıl başlanır?

WordPress site kurma rehberi: Görsel destekli tam kurulumu

Bilgisayarı hızlandırmak için RAM mi SSD mi?

Laptop bataryasının bozuk olduğunu bu şekilde anlayabilirsiniz

Tesla Süper Şarj Cihazları: GM, Ford, Rivian ve erişimi olan diğer EV markaları

İtalyan yemek dağıtım uygulaması Foodinho bir gizlilik cezası daha yedi

Bluesky Başlangıç Paketini Listeye Dönüştürme

Menü

Patronus AI’nin ‘Lynx’iyle tanışın: GPT-4’ü geride bırakan açık kaynaklı saçmalık dedektörü

Yapay zekanın hayal gücüyle mücadele: Lynx, LLM halüsinasyonlarını nasıl tespit edip düzeltiyor?

Açık Kaynak Yapay Zeka: Patronus Yapay Zeka’nın yaygın benimsenme ve para kazanma stratejisi

Yapay zeka güvenilirliğinin geleceği: Giderek otomatikleşen bir dünyada insan gözetimi

İlgili haberler:

Instagram’da satış yapmaya nasıl başlanır?

WordPress site kurma rehberi: Görsel destekli tam kurulumu

Bilgisayarı hızlandırmak için RAM mi SSD mi?

Laptop bataryasının bozuk olduğunu bu şekilde anlayabilirsiniz

Tesla Süper Şarj Cihazları: GM, Ford, Rivian ve erişimi olan diğer EV markaları

İtalyan yemek dağıtım uygulaması Foodinho bir gizlilik cezası daha yedi

Bluesky Başlangıç ​​Paketini Listeye Dönüştürme

Menü

Bluesky Başlangıç Paketini Listeye Dönüştürme