Anthropic’ten Claude, AI uygulamalarınızı hızlı bir şekilde geliştirmek için hızlı bir oyun alanı ekliyor

Hızlı mühendislik geçen yıl AI endüstrisinde sıcak bir iş haline geldi, ancak görünen o ki Anthropic şimdi bunu en azından kısmen otomatikleştirecek araçlar geliştiriyor.

Şirketin bir blog gönderisine göre Anthropic, geliştiricilerin girişimin dil modeli Claude ile daha kullanışlı uygulamalar oluşturmasına yardımcı olmak için Salı günü birkaç yeni özellik yayınladı. Geliştiriciler artık daha iyi girdiler oluşturmak ve Claude’un özel görevlere yönelik yanıtlarını iyileştirmek amacıyla istem mühendisliği tekniklerini kullanarak istemleri oluşturmak, test etmek ve değerlendirmek için artık Claude 3.5 Sonnet’i kullanabilirler.

Dil modelleri, bazı görevleri yerine getirmelerini istediğinizde oldukça bağışlayıcıdır, ancak bazen bir istemin ifadesinde yapılan küçük değişiklikler, sonuçlarda büyük gelişmelere yol açabilir. Normalde bu ifadeyi kendiniz bulmanız veya bunu yapması için hızlı bir mühendis tutmanız gerekir; ancak bu yeni özellik, iyileştirmeleri bulmayı kolaylaştırabilecek hızlı geri bildirimler sunar.

Özellikler Anthropic Console’da yeni bir “Değerlendir” sekmesi altında barındırılıyor. Konsol, startup’ın geliştiricilere yönelik test mutfağıdır ve Claude ile ürün geliştirmek isteyen işletmeleri çekmek için yaratılmıştır. Mayıs ayında tanıtılan özelliklerden biri de Anthropic’in yerleşik bilgi istemi oluşturucusu; bu, bir görevin kısa bir tanımını alır ve Anthropic’in kendi istem mühendisliği tekniklerini kullanarak çok daha uzun, ayrıntılı bir istem oluşturur. Anthropic’in araçları, hızlı mühendislerin yerini tamamen alamayacak olsa da şirket, bunun yeni kullanıcılara yardımcı olacağını ve deneyimli hızlı mühendislere zaman kazandıracağını söyledi.

Geliştiriciler “Değerlendir” kapsamında yapay zeka uygulamalarının istemlerinin çeşitli senaryolarda ne kadar etkili olduğunu test edebilir. Geliştiriciler gerçek dünyadan örnekleri bir test paketine yükleyebilir veya Claude’dan yapay zeka tarafından oluşturulan bir dizi test senaryosu oluşturmasını isteyebilir. Geliştiriciler daha sonra çeşitli istemlerin yan yana ne kadar etkili olduğunu karşılaştırabilir ve örnek yanıtları beş puanlık bir ölçekte derecelendirebilir.

İyi ve kötü yanıtları bulmak için oluşturulan verilerle beslenen bir bilgi istemi.
Resim Kredisi: Antropik

Anthropic’in blog gönderisinden alınan bir örnekte, bir geliştirici, uygulamasının çeşitli test senaryolarında çok kısa yanıtlar verdiğini tespit etti. Geliştirici, yanıtları daha uzun hale getirmek için istemindeki bir satırı değiştirebildi ve bunu tüm test senaryolarına aynı anda uygulayabildi. Bu, geliştiricilerin, özellikle de çok az veya hiç mühendislik deneyimi olmayanların, çok fazla zaman ve emekten tasarruf etmesini sağlayabilir.

Anthropic CEO’su ve Kurucu Ortak Dario Amodei, bu yılın başlarında Google Cloud Next’te yapılan bir röportajda, hızlı mühendisliğin üretken yapay zekanın kurumsal olarak yaygın şekilde benimsenmesi için en önemli şeylerden biri olduğunu söyledi. Amodei, “Kulağa basit geliyor ancak hızlı bir mühendisle 30 dakika çalışmak, çoğu zaman bir uygulamanın daha önce olmadığı halde çalışmasını sağlayabilir” dedi.

Kaynak: https://techcrunch.com/2024/07/09/anthropics-claude-adds-a-prompt-playground-to-quickly-improve-your-ai-apps/