Yalnızca VentureBeat Transform 2024’te OpenAI, Chevron, Nvidia, Kaiser Permanente ve Capital One liderlerini kaçırmayın. Bu üç günlük özel etkinlikte GenAI hakkında önemli bilgiler edinin ve ağınızı genişletin. Daha fazla bilgi edin
iPhone’unuzda bir makale okumaya başladığınızda bir yere arabayla gitmek, yürümek, bisiklete binmek, ev işleri yapmak veya başka bir şekilde gözlerinizi ekrandan ayırmak zorunda kaldıysanız – ElevenLabs’ın sizin için bir uygulaması var.
Eski Palantir mühendisleri tarafından kurulan yapay zeka ses oluşturma şirketi bugün ilk iOS uygulaması olan “ElevenLabs Reader: AI Audio”yu piyasaya sürdü.
Farklı olarak ElevenLabs web sitesinin tamamı Metinden konuşmaya, konuşmayı diğer seslere ve dillere dönüştürme, yapay zeka dublajı ve yapay zeka ses efektleri gibi çeşitli farklı yapay zeka modelleri ve özellikleri içeren yeni ElevenLabs iOS uygulaması, daha dar bir şekilde uyarlanmış ve özellikle metin dosyalarını veya ses dosyalarını dönüştürmeye odaklanmıştır. Kullanıcının hareket halindeyken veya gözleri ve elleriyle başka bir şey yaparken (örneğin barbekü yapmak, akşam yemeği hazırlamak, bulaşıkları kaldırmak vb.) dinleyebileceği web’den sesli anlatıma bağlantılar.
Başlangıçta, bu metinden konuşmaya işlevi uygulamada yalnızca İngilizce olarak mevcut olacak, ancak açılır bir ekran, ElevenLabs’ın web üzerinde desteklediği 29’dan fazla dilin tamamının da yakında iOS Reader uygulamasına geçeceğini gösteriyor.
VB Transform 2024’e Geri Sayım
Amiral gemisi yapay zeka etkinliğimiz için 9-11 Temmuz tarihleri arasında San Francisco’daki kurumsal liderlere katılın. Meslektaşlarınızla bağlantı kurun, Üretken Yapay Zekanın fırsatlarını ve zorluklarını keşfedin ve Yapay Zeka uygulamalarını sektörünüze nasıl entegre edeceğinizi öğrenin. Şimdi üye Ol
Uygulama şu amaçlarla kullanılabilir: Apple App Store’dan ücretsiz indirme ve yazılımın iOS 15 veya daha yeni sürümlerini gerektirir.
Giriş yapmak için mevcut bir ElevenLabs hesabıyla oturum açmanızı veya e-postanız ve şifrenizle ya da Google veya Apple hesabınızı kullanarak yeni bir hesap oluşturmanızı gerektirir.
Giriş yaptığınızda, size, çoğu zaten kamuya açık olan Cinderella, Goldilocks ve Üç Ayı gibi peri masalları ve folklor hikayeleri gibi görünen, sesli anlatımla birlikte önceden yüklenmiş metin dosyalarının bir listesi sunulur. Tavşan Peter’ın Hikayesi ve Sir Arthur Conan Doyle’un klasik Viktorya dönemi gizem dizisi Sherlock Holmes’un Maceraları.
Bu öykülerden herhangi birine dokunduğunuzda metin açılır ve yapay zeka anlatıcının söylediği her kelimeyi takip eden ve vurgulayan yeşil bir etkileşimli vurgulayıcıyla hemen sesli yapay zeka anlatımı başlar.
Elbette biz meşgul yetişkinlerin çoğunun peri masallarının yanı sıra okumamız gereken başka şeyleri de vardır, dolayısıyla uygulamanın ana menüsünün sağ üst köşesinde kullanıcının tıklayıp “Ekle” menüsünü açabileceği bir artı düğmesi de vardır. kendi metinlerini yazmak, mobil web tarayıcılarından kopyalayıp yapıştırdıkları bir URL’yi veya iOS dosyaları uygulamasından bir dosyayı içe aktarmak da dahil olmak üzere kendi içeriklerini” kullanabilirsiniz.
Uygulama aynı zamanda iOS’un varsayılan Paylaşım Sayfasıyla da entegre olur; böylece kullanıcı, iOS Safari tarayıcısının paylaşım sayfasına bir widget ekleyebilir ve tarama sırasında kopyalamaya gerek kalmadan tarayıcı görünümünden ElevenLabs iOS Reader uygulamasına giden bağlantıları paylaşabilir. ve yapıştırın.
Uygulamanın sağ alt köşesindeki 1,0x varsayılan hız göstergesine dokunmak, kullanıcının hızı 0,8x ile 2x arasında artırmasına veya azaltmasına olanak tanır. Ancak, bu hızları bir açılır menüden veya kaydırma menüsünden seçemezsiniz; bunun yerine her biri arasında birer birer geçiş yapmak için dokunmanız yeterlidir; bu, bazı kullanıcılar için biraz can sıkıcı olabilir.
Soldaki simgedeki ses dalgası simgesine dokunmak, kullanıcının erkekten kadına, Amerikan’dan Avusturya’ya ve İngiliz İngilizcesine kadar 11 (natch) farklı ses ve aksan arasından seçim yapmasına olanak tanır.
Testlerimde iOS Dosyalar uygulamamdan ElevenLabs iOS Reader uygulamasına görseller ve grafikler içeren bir PDF dosyası yüklemek birkaç saniye sürdü ve uygulama tüm görselleri çıkarıp yalnızca metni görüntüledi. Ayrıca, anlatımı biraz ödüllendiren biçimlendirmeyle ilgili bazı sorunlar da vardı; uygunsuz anlarda satır sonlarına kadar duraklama.
Ayrıca kısa testlerimde birkaç rastgele hata mesajıyla ve metni sese dönüştürmede başarısızlıkla karşılaştım.
Ancak uygulama yepyeni ve şüphesiz hızla geliştirilecek. Ve AI seslendirme anlatımının gerçek işlevselliği genel olarak şaşırtıcı derecede akıcı, inanılmaz derecede doğru ve ilgi çekiciydi. Hatta VentureBeat makaleleri ve 300’den fazla sayfalık tam bir roman taslağı üzerinde bile çalıştı.
Büyük sorulardan biri, ElevenLabs’ın bir kullanıcının uygulamaya gönderdiği metin verilerinin ve dosyaların tamamını/herhangi birini yakalayıp yakalamadığı, bunları bir yerde saklayıp saklamadığı (ve eğer öyleyse, bunun şifreli ve özel depolama olup olmadığı) ve/veya kullanıcının yapıştırdığı dosyalar üzerinde eğitim verip vermediğidir. veya yükler. Bir yanıt almak için şirkete ulaştık ve yanıt aldığımızda güncellenecektir.
Kaynak: https://venturebeat.com/ai/elevenlabs-launches-ios-app-that-turns-any-text-into-audio-narration-with-ai/