Sektör lideri yapay zeka kapsamına ilişkin en son güncellemeler ve özel içerik için günlük ve haftalık bültenlerimize katılın. Daha fazla bilgi edin
DiffbotDünyanın en büyük endekslerinden birini sağlamasıyla tanınan küçük bir Silikon Vadisi şirketi. web bilgisibugün bu alandaki en büyük zorluklardan biri olan gerçeklere dayalı doğruluk sorununu çözmeyi vaat eden yeni bir yapay zeka modelinin piyasaya sürüldüğünü duyurdu.
yeni modelMeta’nın LLama 3.3’ünün ince ayarlı bir sürümü olan , Graph Retrieval-Augmented Generation olarak bilinen bir sistemin ilk açık kaynaklı uygulamasıdır veya GrafikRAG.
Yalnızca büyük miktarda önceden yüklenmiş eğitim verisine dayanan geleneksel yapay zeka modellerinin aksine, Diffbot’un Yüksek Lisansı şirketin gerçek zamanlı bilgilerinden yararlanır Bilgi Grafiğibir trilyondan fazla birbirine bağlı gerçeği içeren, sürekli güncellenen bir veritabanı.
Diffbot’un kurucusu ve CEO’su Mike Tung, VentureBeat ile yaptığı röportajda, “Genel amaçlı akıl yürütmenin eninde sonunda yaklaşık 1 milyar parametreye ayrılacağına dair bir tezimiz var” dedi. “Aslında modeldeki bilgiyi istemiyorsunuz. Modelin, bilgiyi dışarıdan sorgulayabilmesi için yalnızca araçları kullanma konusunda iyi olmasını istiyorsunuz.”
Nasıl çalışır?
Diffbot’lar Bilgi Grafiği 2016’dan bu yana halka açık web’i tarayan, genişleyen, otomatik bir veritabanıdır. Web sayfalarını kişiler, şirketler, ürünler ve makaleler gibi varlıklara göre kategorilere ayırarak, bilgisayar görüşü ve doğal dil işleme kombinasyonunu kullanarak yapılandırılmış bilgileri çıkarır.
Bilgi Grafiği her dört ila beş günde bir milyonlarca yeni bilgiyle yenilenerek güncel kalması sağlanır. Diffbot’lar Bir modeliniz var eğitim verilerinde kodlanan statik bilgiye güvenmek yerine, bilgi almak için grafiği gerçek zamanlı olarak sorgulayarak bu kaynağı kullanır.
Örneğin, yeni bir haber olayı hakkında soru sorulduğunda model, en son güncellemeleri bulmak için web’de arama yapabilir, ilgili gerçekleri çıkarabilir ve orijinal kaynaklardan alıntı yapabilir. Bu süreç, sistemi geleneksel LLM’lerden daha doğru ve şeffaf hale getirmek için tasarlanmıştır.
Tung, “Bir yapay zekaya hava durumunu sorduğunuzu hayal edin” dedi. “Modelimiz, güncel olmayan eğitim verilerine dayalı bir yanıt oluşturmak yerine, canlı bir hava durumu hizmetini sorguluyor ve gerçek zamanlı bilgilere dayalı bir yanıt sağlıyor.”
Diffbot’un Bilgi Grafiği, gerçekleri bulma konusunda geleneksel yapay zekayı nasıl geride bırakıyor?
Kıyaslama testlerinde Diffbot’un yaklaşımı meyvesini veriyor gibi görünüyor. Şirket, modelinin şu tarihte %81 doğruluk puanına ulaştığını bildirdi: TazeQAgerçek zamanlı olgusal bilgiyi test etmek için Google tarafından oluşturulan ve hem ChatGPT’yi hem de Gemini’yi geride bırakan bir kıyaslamadır. Ayrıca %70,36 puan aldı. MMLU-Prostandart bir akademik bilgi testinin daha zor bir versiyonu.
Belki de en önemlisi Diffbot, modelini tamamen açık kaynak haline getirerek şirketlerin kendi donanımlarında çalıştırmasına ve ihtiyaçlarına göre özelleştirmesine olanak tanıyor. Bu, veri gizliliği ve büyük yapay zeka sağlayıcılarıyla satıcıya bağlı kalma konusunda artan endişeleri gideriyor.
Tung, “Bunu makinenizde yerel olarak çalıştırabilirsiniz” dedi. “Verilerinizi Google’a göndermeden ve tesislerinizin dışına göndermeden Google Gemini’yi çalıştırmanıza imkan yok.”
Açık kaynaklı yapay zeka, kuruluşların hassas verileri işleme biçimini değiştirebilir
Sürüm, yapay zeka geliştirmede çok önemli bir anda geliyor. Son aylarda büyük dil modellerinin eğilimine yönelik eleştirilerin arttığı görüldü:halüsinasyon görmek” veya şirketler model boyutlarını büyütmeye devam ederken bile yanlış bilgi üretin. Diffbot’un yaklaşımı, tüm insan bilgisini sinir ağlarında kodlamaya çalışmak yerine yapay zeka sistemlerini doğrulanabilir gerçeklere dayandırmaya odaklanan alternatif bir yol önermektedir.
Tung, “Herkes daha büyük ve daha büyük modellerin peşinde değil” dedi. “Bizimki gibi sezgisel olmayan bir yaklaşımla büyük bir modelden daha fazla kapasiteye sahip bir modele sahip olabilirsiniz.”
Sektör uzmanları, Diffbot’un bilgi grafiği tabanlı yaklaşımının, doğruluk ve denetlenebilirliğin hayati önem taşıdığı kurumsal uygulamalar için özellikle değerli olabileceğini belirtiyor. Şirket halihazırda büyük firmalara veri hizmetleri sağlıyor. Cisco, ÖrdekDuckGoVe Snapchat’te.
Model, açık kaynak sürümü aracılığıyla hemen kullanıma sunuldu. GitHub ve şu adreste halka açık bir demo aracılığıyla test edilebilir: diffy.chat. Diffbot, bunu dahili olarak dağıtmak isteyen kuruluşlar için 8 milyar parametrelik daha küçük sürümün tek bir cihazda çalışabileceğini söylüyor Nvidia A100 GPU70 milyar parametreli sürümün tamamı iki tane gerektirirken H100 GPU’lar.
İleriye baktığımızda Tung, yapay zekanın geleceğinin daha büyük modellerde değil, insan bilgisini organize etmenin ve ona erişmenin daha iyi yollarında yattığına inanıyor: “Gerçekler bayatlıyor. Bu gerçeklerin çoğu, bilgiyi gerçekten değiştirebileceğiniz ve veri kaynağına sahip olabileceğiniz açık yerlere taşınacak.
Yapay zeka endüstrisi gerçeklere dayalı doğruluk ve şeffaflık konusundaki zorluklarla boğuşurken Diffbot’un sürümü, baskın olan daha büyük olan daha iyidir paradigmasına karşı ilgi çekici bir alternatif sunuyor. Alanın yönünü değiştirmeyi başarıp başaramayacağını zaman gösterecek ancak konu yapay zeka olduğunda boyutun her şey olmadığını kesinlikle gösterdi.
Kaynak: https://venturebeat.com/ai/diffbots-ai-model-doesnt-guess-it-knows-thanks-to-a-trillion-fact-knowledge-graph/