Amazon, bir ses AI modelini ortaya çıkaran en son teknoloji devidir. Amazon’a göre, Nova Sonic “AI uygulamalarında daha fazla insan benzeri sesli konuşmalar sağlamak için konuşma anlayışını ve konuşma üretimini tek bir modele dönüştüren yeni bir temel modeli”. Nova Sonic, Openai, Google ve diğer teknoloji şirketleri tarafından benzer AI modelleriyle rekabet edecek.
Nova Sonic kelimelerden daha fazlasını anlıyor
Nova Sonic sadece konuşmacının sözlerini anlamamakla kalmaz, aynı zamanda tonu, stili ve tempoyu da işleyebilir. AI ses jeneratörü konuşma bağlamına uyum sağlar, bu nedenle Alexa’nın ilk nesillerinden daha stiled modellere kıyasla diyalog daha doğal olarak akar. Nova Sonic bunu yapabilir, çünkü birden fazla konuşma işleme ve üretim işlevlerini birden fazla farklı model kullanmak yerine tek bir AI modelinde birleştirir.
Geleneksel olarak, AI ses araçları ile ilgili çoklu modelleri sırayla çalıştırıyor: Bir konuşma tanıma modeli konuşmayı metne dönüştürecek, daha sonra büyük bir dil modeli (LLM) giriş metnini işleyecek ve yanıtlar üretecek ve son olarak bir metin-konuşma modeli metni tekrar sese dönüştürecektir. Bu karmaşık boru hattı genellikle hoparlörün orijinal diyaloğunun tonunu, stilini ve hızını ortadan kaldırdı.
Nova Sonic tüm bunları bir modelde birleştirdiğinden, giriş konuşmasının akustik bağlamına uyum sağlayabilir. Ayrıca insan konuşmasının kadanslarına daha doğal olarak yanıt verir; Örneğin, konuşmacı tereddüt ettiğinde veya bir nefes almak için duraklamada durmaz.
Nova Sonic nasıl alınır
Nova Sonic şu anda şirketin kurumsal uygulama oluşturma platformu Amazon Bedrock’taki yeni bir API aracılığıyla mevcut ve ses uygulamalarının geliştirilmesini basitleştirecek.
Geliştiricilerin Amazon Nova hakkında bilmesi gerekenler
Teknoloji devi kısa süre önce bir web tarayıcısında işlem yapmak için eğitilmiş yeni bir AI modeli olan Amazon Nova Act’i tanıttı. Buna ek olarak, geliştiricilerin keşfetmesi için bir Amazon Nova SDK var. Vakıf modellerinden biri, yüksek kaliteli görüntüler üretmek için Nova Canvas; Farklı yöntemlerden metin ve metin ve görüntü girişinden videolar oluşturmak için modeller de vardır.
Kaynak: https://www.techrepublic.com/article/news-amazon-nova-sonic-ai/