Meta, Google’ın NotebookLM’sinde viral bir podcast oluşturma özelliğinin “açık” bir uygulamasını yayınladı.
NotebookLlama olarak adlandırılan proje, şaşırtıcı olmayan bir şekilde, işlemenin büyük bir kısmı için Meta’nın kendi Llama modellerini kullanıyor. NotebookLM gibi, kendisine yüklenen metin dosyalarının ileri geri, podcast tarzı özetlerini oluşturabilir.
NotebookLlama ilk önce bir dosyadan bir metin oluşturur; örneğin bir haber makalesinin veya blog yazısının PDF’si. Ardından, transkripti açık metinden konuşmaya modellere beslemeden önce “daha fazla dramatizasyon” ve kesintiler ekler.
Sonuçlar NotebookLM kadar iyi görünmüyor. Dinlediğim NotebookLlama örneklerinde, seslerin oldukça robotik bir niteliği var ve tuhaf noktalarda birbirleriyle konuşma eğilimindeler.
Ancak projenin arkasındaki Meta araştırmacıları, daha güçlü modellerle kalitenin artırılabileceğini söylüyor.
NotebookLlama’nın GitHub sayfasında “Metinden konuşmaya modeli bunun kulağa ne kadar doğal geleceğini sınırlıyor” diye yazdılar. “[Also,] Podcast yazmanın başka bir yaklaşımı da iki temsilcinin ilgilenilen konuyu tartışmasını ve podcast taslağını yazmasını sağlamak olabilir. Şu anda podcast taslağını yazmak için tek bir model kullanıyoruz.”
NotebookLlama, NotebookLM’nin podcast özelliğini taklit eden ilk girişim değil. Bazı projeler diğerlerinden daha fazla başarı elde etti. Ancak hiçbiri, hatta NotebookLM’in kendisi bile tüm yapay zekanın peşini bırakmayan halüsinasyon sorununu çözmeyi başaramadı. Yani yapay zeka tarafından oluşturulan podcast’lerin bazı uydurma şeyler içermesi kaçınılmazdır.
Kaynak: https://techcrunch.com/2024/10/27/meta-releases-an-open-version-of-googles-podcast-generator/