Sektör lideri yapay zeka kapsamına ilişkin en son güncellemeler ve özel içerik için günlük ve haftalık bültenlerimize katılın. Daha fazla bilgi edin
Kurumlar dağıtmaya başladıkları aracıları daha gözlemlenebilir hale getirmek istediklerinden, ajansal yapay zekanın bir sonraki aşaması yalnızca değerlendirme ve izleme olabilir.
Sırasında Yapay zeka aracı kıyaslamaları yanıltıcı olabilirtemsilcinin istediği şekilde çalışıp çalışmadığını görmenin çok değeri var. Bu amaçla şirketler, müşterilerin yapay zeka aracılarını sanal ortamda tutabilecekleri veya performanslarını değerlendirebilecekleri platformlar sunmaya başlıyor.
Satış gücü temsilci değerlendirme platformu Agentforce Testing Center’ı Çarşamba günü sınırlı bir pilot olarak yayınladı. Aralık ayında genel kullanıma sunulması bekleniyor. Test Merkezi, kuruluşların ihtiyaç duydukları iş akışlarına ve verilere erişmelerini sağlamak için AI aracılarını gözlemlemelerine ve prototip oluşturmalarına olanak tanır.
Test Merkezi’nin yeni yetenekleri arasında Agentforce için yapay zeka tarafından oluşturulan testler, Agentforce için Korumalı Alanlar ve Veri Bulutu ile Agentforce için izleme ve gözlemlenebilirlik yer alıyor.
Yapay zeka tarafından oluşturulan testler, şirketlerin yapay zeka modellerini kullanarak temsilcilerin şirketlerin istediği şekilde yanıt verip vermediğini test etmek için “yüzlerce sentetik etkileşim” oluşturmasına olanak tanır. Adından da anlaşılacağı gibi sanal alanlar, aracıların onlar için nasıl çalışacağını daha iyi yansıtacak şekilde bir şirketin verilerini yansıtırken, aracıları test etmek için yalıtılmış bir ortam sunar. İzleme ve gözlemlenebilirlik, kuruluşların, aracılar üretime geçtiğinde sanal alana bir denetim izi getirmesine olanak tanır.
Salesforce’un ürün ve endüstri pazarlamasından sorumlu başkan yardımcısı Patrick Stokes, VentureBeat’e Test Merkezinin şirketin Ajan Yaşam Döngüsü Yönetimi adını verdiği yeni bir temsilci sınıfının parçası olduğunu söyledi.
Stokes, “Ajanların yeni ve büyük bir alt kategorisi olacağını düşündüğümüz bir kategoriyi konumlandırıyoruz” dedi. “Yaşam döngüsü derken, doğuştan gelişmeye, dağıtıma kadar her şeyi ve ardından siz ilerledikçe dağıtımınızın yinelemelerini kastediyoruz.”
Stokes, şu anda Test Merkezi’nin, geliştiricilerin API’deki, verilerdeki veya kullanılan aracıların modelindeki belirli seçenekleri görebilecekleri iş akışına özgü içgörülere sahip olmadığını söyledi. Ancak Salesforce bu tür verileri Einstein Güven Katmanında toplar.
Stokes, “Yaptığımız şey, bu meta verileri müşterilerimize sunacak geliştirici araçları oluşturmak, böylece onların bunu aracılarını daha iyi oluşturmak için gerçekten kullanabilmelerini sağlamak” dedi.
Salesforce şapkasını AI temsilcilerine asıyor ve enerjisinin çoğunu kendi acente teklifi Agentforce. Salesforce müşterileri, örneklerine bağlanmak için önceden ayarlanmış aracıları kullanabilir veya Agentforce’ta özelleştirilmiş aracılar oluşturabilir.
Değerlendirme aracıları
Yapay zeka aracıları bir kuruluştaki birçok noktaya dokunur ve iyi aracılı ekosistemler, iş akışlarının büyük bir kısmını otomatikleştirmeyi ve bunların iyi çalışmasını sağlamayı amaçladığından gerekli hale gelir.
Bir temsilci yanlış API’ye dokunmaya karar verirse, bu durum işletme için felaket anlamına gelebilir. Yapay zeka ajanları, kendilerini destekleyen modeller gibi doğası gereği stokastiktir ve bir sonuca varmadan önce her potansiyel olasılığı dikkate alır. Stokes, Salesforce’un temsilcileri aynı ifadelerin veya soruların versiyonlarıyla kışkırtarak temsilcileri test ettiğini söyledi. Yanıtları başarılı veya başarısız olarak puanlanır ve aracının, insan geliştiricilerin kontrol edebileceği güvenli bir ortamda öğrenmesine ve gelişmesine olanak tanır.
İşletmelerin yapay zeka aracılarını değerlendirmesine yardımcı olan platformlar, hızla yeni bir ürün teklifi türü haline geliyor. Haziran ayında müşteri deneyimi yapay zeka şirketi Sierra AI aracı karşılaştırmasını başlattı Konuşma aracılarının performansına bakmak için TAU-bench’i çağırdık. Otomasyon şirketi UiPath serbest bıraktı Ekim ayında Agent Builder platformu bu aynı zamanda tam dağıtımdan önce aracı performansını değerlendirmeye yönelik bir araç da sunuyordu.
Yapay zeka uygulamalarını test etmek yeni bir şey değil. AWS Bedrock ve Microsoft Azure gibi birçok yapay zeka modeli deposu, model performanslarını karşılaştırmanın yanı sıra, müşterilerin kendi kullanım durumları için hangisinin en iyi sonucu verdiğini görmek amacıyla temel modelleri kontrollü bir ortamda test etmelerine olanak tanıyor.
Kaynak: https://venturebeat.com/ai/salesforce-launches-agentforce-testing-center-to-put-agents-through-paces/