Yapay zeka destekli sanat yaratıcısı Stable Diffusion’ın arkasındaki startup olan Stability AI, yalnızca telifsiz kayıtlar üzerine eğitildiğini iddia ettiği sesler ve şarkılar üretmek için açık bir yapay zeka modeli yayınladı.
Stabil Ses Açık olarak adlandırılan üretken model, bir metin açıklaması alır (örneğin, “İşlenmiş bir stüdyoda çalınan rock ritmi, akustik kit üzerinde davul çalma seansı”) ve 47 saniyeye kadar uzunlukta bir kayıt çıkışı sağlar. Model, ücretsiz müzik kütüphaneleri FreeSound ve Free Music Archive’dan yaklaşık 486.000 örnek kullanılarak eğitildi.
Stability AI, modelin videolar, filmler ve TV şovları için davul ritimleri, enstrüman melodileri, ortam sesleri ve “prodüksiyon öğeleri” oluşturmanın yanı sıra mevcut şarkıları “düzenlemek” veya bir şarkının stilini uygulamak (örn. pürüzsüz) için kullanılabileceğini söylüyor caz) diğerine.
Stability AI, kurumsal blogunda yayınlanan bir gönderide, “Bu açık kaynak sürümünün önemli bir avantajı, kullanıcıların modele kendi özel ses verileri üzerinde ince ayar yapabilmesidir” diye yazdı. “Örneğin, bir davulcu yeni ritimler oluşturmak için kendi davul kayıtlarının örneklerine ince ayar yapabilir.”
Ancak Stabil Ses Açık’ın sınırlamaları vardır. Tam şarkılar, melodiler veya vokaller üretemez; en azından iyi olanları. Stabilite AI bunun için optimize edilmediğini söylüyor ve bu yetenekleri arayan kullanıcıların şirketin premium Stabil Ses hizmetini tercih etmelerini öneriyor.
Stable Audio Open ticari olarak da kullanılamaz; hizmet şartları bunu yasaklıyor. Ayrıca müzik tarzları ve kültürleri arasında veya İngilizce dışındaki dillerdeki açıklamalarda eşit derecede iyi performans göstermiyor; bu durum Stabilite Yapay Zekasının eğitim verilerini suçladığını gösteriyor.
Stability AI, modelin açıklamasında şöyle yazıyor: “Veri kaynağı potansiyel olarak çeşitlilikten yoksun ve tüm kültürler veri setinde eşit şekilde temsil edilmiyor.” “Modelden oluşturulan örnekler, eğitim verilerinden gelen önyargıları yansıtacaktır.”
Uzun süredir zayıflayan işini tersine çevirmek için çabalayan Stabilite Yapay Zekası, üretken sesten sorumlu başkan yardımcısı Ed Newton-Rex’in, şirketin üretken yapay zeka modellerini telif hakkıyla korunan eserler üzerinde eğitmenin “adil” olduğu yönündeki tutumuna karşı çıkması nedeniyle yakın zamanda tartışma konusu haline geldi. kullanmak.” Stable Audio Open, bu anlatıyı tersine çevirme girişimi gibi görünürken aynı zamanda Stability AI’nin ücretli ürünlerinin reklamını o kadar da incelikli olmayan bir şekilde yapıyor gibi görünüyor.
Kaynak: https://techcrunch.com/2024/06/05/stability-ai-releases-a-sound-generator/