Senden duymak istiyoruz! Hızlı yapay zeka anketimize katılın ve yapay zekanın mevcut durumu, onu nasıl uyguladığınız ve gelecekte ne görmeyi beklediğiniz hakkındaki görüşlerinizi paylaşın. Daha fazla bilgi edin
Patronus AINew York merkezli bir girişim, açıldı Vaşak bugün, bir açık kaynak modeli Büyük dil modellerinde (LLM’ler) halüsinasyonları tespit etmek ve azaltmak için tasarlanmıştır. Bu atılım, farklı sektörlerdeki işletmelerin yapay zeka tarafından oluşturulan içeriğin güvenilirliğiyle boğuşması nedeniyle kurumsal yapay zekanın benimsenmesini yeniden şekillendirebilir.
Lynx, halüsinasyon tespit görevlerinde OpenAI’nin GPT-4’ü ve Anthropic’in Claude 3’ü gibi sektör devlerini geride bırakarak yapay zeka güvenilirliğinde önemli bir ilerlemeyi temsil ediyor. Patronus AI, Lynx’in tıbbi hataları tespit etmede GPT-4’ten %8,3 daha yüksek doğruluk elde ettiğini ve tüm görevlerde GPT-3,5’i %29 oranında aştığını bildirdi.
Yapay zekanın hayal gücüyle mücadele: Lynx, LLM halüsinasyonlarını nasıl tespit edip düzeltiyor?
Patronus AI CEO’su Anand Kannappan, VentureBeat ile yaptığı röportajda bu gelişmenin önemini açıkladı. “Büyük dil modellerinde halüsinasyonlar, yapay zekanın yanlış veya yanıltıcı bilgiler üretmesi ve her şeyi gerçekmiş gibi uydurması durumunda ortaya çıkıyor” dedi. “İşletmeler için bu, yanlış karar almaya, yanlış bilgilendirmeye ve müşterilerde güven kaybına yol açabilir.”
Patronus AI da yayınlandı HaluBenchGerçek dünya senaryolarında yapay zeka modelinin doğruluğunu değerlendirmek için yeni bir referans noktası. Bu araç, doğruluğun çok önemli olduğu finans ve tıp alanlarındaki alana özgü görevleri içermesiyle öne çıkıyor.
VB Transform On-Demand’e erişmek için kaydolun
VB Transform 2024 için yüz yüze kartlar artık tükendi! Fırsatı kaçırmayın; konferanstan sonra sunulan özel isteğe bağlı erişim için şimdi kaydolun. Daha fazla bilgi edin
Kannappan, “Finans, sağlık hizmetleri, hukuk hizmetleri gibi hassas ve kesin bilgilerle uğraşan endüstriler ve sıkı veri doğruluğu gerektiren tüm sektörler Lynx’ten büyük fayda sağlayacak” dedi. “Halüsinasyonları tespit etme ve düzeltme yeteneği, kritik kararların doğru verilere dayanmasını sağlıyor.”
Açık Kaynak Yapay Zeka: Patronus Yapay Zeka’nın yaygın benimsenme ve para kazanma stratejisi
Açık kaynak kararı Vaşak Ve HaluBench endüstrilerde daha güvenilir yapay zeka sistemlerinin benimsenmesini hızlandırabilir. Ancak bu aynı zamanda Patronus AI’nın iş modeliyle ilgili soruları da gündeme getiriyor.
Kannappan bu endişeyi şöyle dile getirdi: “Ölçeklenebilir API erişimi, gelişmiş değerlendirme özellikleri ve iş akışları ve belirli iş ihtiyaçlarına göre uyarlanmış özel entegrasyonlar içeren kurumsal çözümlerimizle Lynx’ten para kazanmayı planlıyoruz.” Bu yaklaşım, açık kaynak temelleri üzerine kurulu birinci sınıf hizmetler sunan yapay zeka şirketlerinin daha geniş eğilimiyle uyumludur.
Lynx’in lansmanı yapay zeka gelişiminde kritik bir dönemeçte geliyor. İşletmeler çeşitli uygulamalar için giderek daha fazla Yüksek Lisans’a güveniyor ve bu da sağlam değerlendirme ve hata tespit araçlarına acil bir ihtiyaç yaratıyor. Patronus AI’nın yeniliği, AI sistemlerine güven oluşturmada önemli bir rol oynayabilir ve potansiyel olarak bunların kritik iş süreçlerine entegrasyonunu hızlandırabilir.
Yapay zeka güvenilirliğinin geleceği: Giderek otomatikleşen bir dünyada insan gözetimi
Ufukta zorluklar devam ediyor. Kannappan şunu belirtti: “Bir sonraki büyük zorluk, insanların yapay zeka çıktılarını etkili bir şekilde denetlemesine ve doğrulamasına olanak tanıyan ölçeklenebilir gözetim mekanizmaları geliştirmek olacak.” Bu, Lynx gibi araçlar otomatik değerlendirmenin sınırlarını zorlarken bile yapay zeka dağıtımında insan uzmanlığına olan ihtiyacın devam ettiğini vurguluyor.
Yapay zeka ortamı hızla geliştikçe, Patronus Yapay Zeka’nın katkısı, daha güvenilir ve güvenilir yapay zeka sistemlerine doğru önemli bir adıma işaret ediyor. Yapay zekanın benimsenmesinin karmaşık dünyasında yol alan kurumsal liderler için Lynx gibi araçların, riskleri azaltmada ve bu dönüştürücü teknolojinin potansiyelini en üst düzeye çıkarmada çok değerli olduğu kanıtlanabilir.
Kaynak: https://venturebeat.com/ai/meet-patronus-ais-lynx-the-open-source-bullshit-detector-outsmarting-gpt-4/