Lightspeed Ventures destekli ses platformu Pocket FM, komut dosyası gibi metin içeriğini yapay zeka kullanarak hızlı bir şekilde ses serisine dönüştürmek için ses klonlama şirketi ElevenLabs ile ortaklık kurduğunu duyurdu.
Mart ayında D Serisi finansmanında 103 milyon dolar toplayan Pocket FM, o sırada TechCrunch’a ElevenLabs teknolojisini kullanarak metin içeriğini sese dönüştürme yeteneğini zaten denediğini söyledi. Artık Hindistan merkezli şirket, dönüşüm aracını önümüzdeki birkaç hafta içinde tüm içerik oluşturucuların kullanımına sunmak için ortaklığı genişletti.
Test aşamasında Pocket FM, ElevenLab’ın yapay zeka teknolojisini kullanarak halihazırda 30.000 saatlik ses serisi üretti. Yeni lansmanla birlikte girişim, bu yıl 100.000 saatin üzerinde ses içeriğinden oluşan içerik kütüphanesini üç katına çıkarmayı bekliyor. Pocket FM ayrıca deneysel aşamada yapay zeka destekli araçların ses üretim maliyetini %90 oranında azaltmasına yardımcı olduğunu söyledi.
Pocket FM’in kurucu ortağı ve CTO’su Prateek Dixit, TechCrunch’a yaptığı bir görüşmede bu ortaklıkla şirketin yazarların yazılarını ses serilerine dönüştürmesini kolaylaştırmak istediğini söyledi.
“250.000’den fazla yazarımız var (şirketin Cep Romanı yazma platformundakiler de dahil) ve bu ortaklık, onlar için kurulum ve ses kaydetme maliyetlerini azaltıyor” dedi.
“Kayıt araçları ve ekipmanlarının iyi bir kurulumuyla bile, yazarlar günde yaklaşık 30 dakikalık yüksek kaliteli ses içeriği üretebilirler. Yapay zeka araçlarıyla bu çıktı 10 kat daha fazla olabilir” diye ekledi.
Pocket FM, ElevenLabs teknolojisini entegre eden bir araç geliştirdi ve bu araç aracılığıyla içeriklerini dönüştürmek isteyen yazarlara 50 ses sunuyor. ElevenLabs’ın kurucu ortağı Mati Staniszewski, şirketinin aracının yazının içeriğini anladığını ve ses aracılığıyla duyguları otomatik olarak çıkardığını söyledi.
Staniszewski, “Pocket FM ile çalışarak yazma türünü daha iyi anlayan ve duygusallığı daha iyi anlayan yeni modellerimizi devreye alıyoruz” dedi.
Dixit, kullanıcıların bu tür içeriklerle etkileşiminden elde edilen verilere dayanarak platformun belirli bir türdeki yazarlar için iyi sonuç veren sesler önermeyi de planladığını belirtti.
Pocket FM, yapay zeka destekli araçları deneyen tek ses serisi platformu değil. Google destekli Kuku FM, yazarlarına senaryoyu iyileştirme, küçük resimler oluşturma, ses efektleri ekleme ve metni sese dönüştürme dahil olmak üzere farklı oluşturma aşamalarında yardımcı olmak için GPT-4, Claude, BandLab ve hatta ElevenLabs’ı kullanıyor.
Kuku FM, TechCrunch’a içerikle ilgili reklamlar oluşturmak için MidJourney ve Runway gibi görsel oluşturma araçlarını kullanmayı da denediğini söyledi.
İçeriğin kalitesi ve sanatçılar üzerindeki etkisi
Yapay zeka destekli araçların vaadi, daha fazla içeriğin daha hızlı üretilmesidir ancak bu, içeriğin iyi olduğu anlamına gelmez. Pocket FM’in keşfedilmeye yardımcı olma ve kaliteli içeriği ortaya çıkarma konusundaki cevabı, keşif algoritmasını karmaşık hale getirmek ve kullanıcı etkileşimi konusunda deneysel hale getirmektir.
“Bir yazar bir ses dizisi yayınlarsa, bu içeriği seçilmiş sayıda kullanıcıya gösteriyoruz ve etkileşim ölçümlerini gözlemliyoruz. Dixit, “Eğer bu ölçümler olumluysa, bunu daha da yayıyoruz” dedi.
Yapay zekanın kullanılması bu platformlar için daha hızlı sonuçlara ve daha büyük bir içerik kütüphanesine yol açabilir, ancak aynı zamanda onlarla çalışan seslendirme sanatçılarının rollerini de azaltacaktır. Hindistan Seslendirme Sanatçıları Derneği (AVA), yapay zekanın kontrolü ele almasıyla ilgili endişelerini dile getirdi.
“Yapay zeka kontrolü ele alırsa işimiz biter. Derneğin genel sekreteri Amarinder Singh Sodhi, Hintli yayın Scroll’a, ses sanatçıları olarak geçim kaynağımızın korunması için bazı düzenlemeleri uygulamaya koymamız gerektiğini söyledi.
Sodi ayrıca Scroll’a, yapay zekayı eğitmek amacıyla seslendirme sanatçılarının rızaları alınmadan veya kendilerine bilgi verilmeden örnekleri kaydetmeleri için stüdyoya çağrıldıkları olayları da anlattı.
“Duygusal düzeyde bu beni korkutuyor. Yapay zekayı kullanarak aslında insanın hikaye anlatma deneyimini sulandırıyorsunuz. Duygusal bağınızı kaybedersiniz.” Delhi merkezli seslendirme sanatçısı Aditya Mattoo TechCrunch’a söyledi.
Kaliteli içerik üretme zevkini ve becerisini geliştirmemiş kişilere premium seslere erişim hakkı verilmesinin, pazarın kötü içerikle dolup taşmasına yol açacağını ekledi.
Yapay zeka destekli ses üretiminin Pocket FM üzerindeki etkisini sorduğumuzda şirket soruyu doğrudan yanıtlamadı. Ancak Dixit, deneylerinde yapay zeka tarafından oluşturulan içerikle etkileşimin “insan seslendirme prodüksiyonu kadar iyi” olduğunu belirtti. Şirket aynı zamanda birden fazla sesi tek bir ses çıkışına dahil edecek teknoloji üzerinde de çalışıyor.
Hem Pocket FM hem de Kuku FM, şu anda içeriklerini, oluşturma sürecinde yapay zeka kullanılıp kullanılmadığını gösterecek şekilde etiketlememektedir.
Kaynak: https://techcrunch.com/2024/06/20/pocket-fm-partners-with-elevenlabs-to-convert-scripts-into-audio-content-quickly/