Sektör lideri yapay zeka kapsamına ilişkin en son güncellemeler ve özel içerik için günlük ve haftalık bültenlerimize katılın. Daha fazla bilgi edin
ChatGPT’nin halka açık çıkışının üzerinden iki yıl geçtikten sonra, her sektördeki şirketlerin yapay zekadan yararlanmak istemesi nedeniyle yapay zeka hakkındaki konuşmalar kaçınılmaz hale geldi büyük dil modelleri (LLM’ler) iş süreçlerini dönüştürmek için. Ancak, yüksek lisanslar ne kadar güçlü ve umut verici olsa da, pek çok işletme ve BT lideri onlara aşırı güvenmeye ve sınırlamalarını gözden kaçırmaya başladı. Bu nedenle uzmanlaşmış dil modellerinin veya SLM’lerin kurumsal BT’de daha büyük ve tamamlayıcı bir rol oynayacağı bir gelecek öngörüyorum.
SLM’ler daha çok “küçük dil modelleri” olarak anılır çünkü daha az veri ve eğitim süresi gerektirirler ve “Yüksek Lisans’ın daha akıcı versiyonları.” Ancak “uzmanlaşmış” kelimesini tercih ediyorum çünkü bu amaca yönelik olarak oluşturulmuş çözümlerin yüksek düzeyde uzmanlık gerektiren işleri yüksek lisans eğitimlerine göre daha fazla doğruluk, tutarlılık ve şeffaflıkla gerçekleştirme yeteneğini daha iyi ifade ediyor. Kuruluşlar, Yüksek Lisans’ları SLM’lerle destekleyerek her modelin güçlü yönlerinden yararlanan çözümler yaratabilirler.
Güven ve Yüksek Lisans ‘kara kutu’ sorunu
Yüksek Lisans’lar inanılmaz derecede güçlüdür, ancak bazen “olay örgüsünü kaybetmeleri” veya genel eğitimleri ve büyük veri kümeleri nedeniyle rotadan sapan çıktılar sunmalarıyla da tanınırlar. Bu eğilim şu gerçeğiyle daha da sorunlu hale geliyor: OpenAI’nin ChatGPT’si ve diğer Yüksek Lisanslar aslında bir cevaba nasıl ulaştıklarını açıklamayan “kara kutulardır”.
Bu kara kutu sorunu, özellikle doğruluk, tutarlılık ve uyumluluğun çok önemli olduğu şirketler ve iş açısından kritik uygulamalar için gelecekte daha büyük bir sorun haline gelecektir. Yanlış cevapların büyük mali sonuçlara ve hatta ölüm kalım sonuçlarına yol açabileceği mesleklerin başlıca örnekleri olarak sağlık hizmetlerini, finansal hizmetleri ve hukuk hizmetlerini düşünün. Düzenleyici kurumlar şimdiden bu durumu dikkate alıyor ve muhtemelen talepte bulunmaya başlayacaklar. açıklanabilir yapay zeka çözümleriözellikle veri gizliliğine ve doğruluğuna önem veren sektörlerde.
İşletmeler bu sorunları hafifletmek için sıklıkla “döngüdeki insan” yaklaşımını uygularken, Yüksek Lisans’lara aşırı güvenmek yanlış bir güvenlik hissine yol açabilir. Zamanla kayıtsızlık ortaya çıkabilir ve hatalar fark edilmeden gözden kaçabilir.
SLM’ler = daha fazla açıklanabilirlik
Neyse ki SLM’ler, LLM’lerin birçok sınırlamasını gidermeye daha uygundur. SLM’ler genel amaçlı görevler için tasarlanmaktan ziyade daha dar bir odaklanma ile geliştirilir ve alana özgü veriler üzerinde eğitilir. Bu özgüllük, hassasiyetin çok önemli olduğu alanlarda incelikli dil gereksinimlerini karşılamalarına olanak tanır. SLM’ler geniş, heterojen veri kümelerine güvenmek yerine hedeflenen bilgiler üzerinde eğitilir ve onlara bağlamsal zeka daha tutarlı, öngörülebilir ve alakalı yanıtlar sunmak.
Bu çeşitli avantajlar sunar. Birincisi, daha açıklanabilir olmaları, çıktılarının ardındaki kaynağın ve mantığın anlaşılmasını kolaylaştırmaktadır. Bu, kararların bir kaynağa kadar takip edilmesi gereken düzenlemeye tabi endüstrilerde kritik öneme sahiptir.
İkincisi, daha küçük boyutları, LLM’lerden genellikle daha hızlı performans gösterebilecekleri anlamına gelir; bu, gerçek zamanlı uygulamalar için çok önemli bir faktör olabilir. Üçüncüsü, SLM’ler, özellikle şirket içinde dağıtıldıkları veya kuruluş için özel olarak oluşturuldukları takdirde, işletmelere veri gizliliği ve güvenliği üzerinde daha fazla kontrol olanağı sunar.
Ayrıca, SLM’ler başlangıçta özel eğitim gerektirebilirken, dış sağlayıcılar tarafından kontrol edilen üçüncü taraf LLM’lerin kullanılmasıyla ilişkili riskleri azaltır. Bu kontrol, sıkı veri işleme ve uyumluluk gerektiren uygulamalarda çok değerlidir.
Uzmanlık geliştirmeye odaklanın (ve aşırı vaatte bulunan satıcılara karşı dikkatli olun)
şunu açıklığa kavuşturmak istiyorum Yüksek Lisans ve SLM’ler birbirini dışlayan değildir. Uygulamada, SLM’ler LLM’leri güçlendirebilir ve LLM’lerin daha geniş bağlam sağladığı ve SLM’lerin hassas yürütme sağladığı hibrit çözümler yaratabilir. Ayrıca Yüksek Lisans’lar söz konusu olduğunda bile henüz erkendir, bu nedenle teknoloji liderlerine her zaman Yüksek Lisans’ın birçok olanağını ve faydasını keşfetmeye devam etmelerini tavsiye ederim.
Buna ek olarak, Yüksek Lisans’lar çeşitli problemler için iyi ölçeklenebilirken, SLM’ler belirli kullanım durumlarına iyi bir şekilde aktarılamayabilir. Bu nedenle, hangi kullanım senaryolarının ele alınacağı konusunda net bir anlayışa sahip olmak önemlidir.
İş dünyası ve BT liderlerinin, SLM’lerin eğitimi, ince ayarları ve test edilmesi için gereken farklı becerileri geliştirmeye daha fazla zaman ve dikkat ayırması da önemlidir. Neyse ki Coursera, YouTube ve gibi ortak kaynaklar aracılığıyla çok sayıda ücretsiz bilgi ve eğitim mevcut. Huggingface.co. Yapay zeka uzmanlığı savaşı yoğunlaştıkça liderler, geliştiricilerinin SLM’leri öğrenmek ve denemek için yeterli zamana sahip olduğundan emin olmalıdır.
Ayrıca liderlere ortaklarını dikkatli bir şekilde incelemelerini tavsiye ediyorum. Geçenlerde bir teknoloji sağlayıcısının iddiaları hakkında fikrimi isteyen bir şirketle konuştum. Bana göre ya iddialarını abartıyorlar ya da teknolojinin yeteneklerini anlama konusunda derinliklerini aşıyorlar.
Şirket akıllıca bir adım attı ve satıcının iddialarını test etmek için kontrollü bir kavram kanıtlaması uyguladı. Şüphelendiğim gibi, çözüm prime time’a hazır değildi ve şirket nispeten az zaman ve para yatırımı yaparak işin içinden çıkabildi.
Bir şirket ister kavram kanıtlamayla ister canlı dağıtımla başlasın, onlara küçük başlamalarını, sık sık test etmelerini ve erken başarıların üzerine inşa etmelerini tavsiye ediyorum. Kişisel olarak küçük bir dizi talimat ve bilgiyle çalışmayı deneyimledim, ancak daha sonra modeli daha fazla bilgiyle beslediğimde sonuçların rotadan saptığını gördüm. Bu nedenle yavaş ve istikrarlı bir yaklaşım ihtiyatlı bir yaklaşımdır.
Özetle, Yüksek Lisans’lar her zamankinden daha değerli yetenekler sağlamaya devam ederken, işletmeler yapay zekaya olan bağımlılıklarını ölçeklendirdikçe sınırlamaları da giderek daha belirgin hale geliyor. SLM’leri desteklemek, özellikle doğruluk ve açıklanabilirlik gerektiren yüksek riskli alanlarda ileriye yönelik bir yol sunar. Şirketler, SLM’lere yatırım yaparak yapay zeka stratejilerini geleceğe hazırlayabilir, araçlarının yalnızca inovasyonu teşvik etmekle kalmayıp aynı zamanda güven, güvenilirlik ve kontrol taleplerini de karşılamasını sağlayabilir.
AJ Sunder, Responsive’in kurucu ortağı, CIO’su ve CPO’sudur.
Veri Karar Vericileri
VentureBeat topluluğuna hoş geldiniz!
DataDecisionMakers, veri çalışması yapan teknik kişiler de dahil olmak üzere uzmanların veriyle ilgili içgörüleri ve yenilikleri paylaşabileceği yerdir.
En son fikirleri, güncel bilgileri, en iyi uygulamaları ve veri ile veri teknolojisinin geleceğini okumak istiyorsanız DataDecisionMakers’ta bize katılın.
Hatta düşünebilirsiniz bir makaleye katkıda bulunmak kendinin!
Kaynak: https://venturebeat.com/ai/large-language-overkill-how-slms-can-beat-their-bigger-resource-intensive-cousins/