OpenAI, Salı günü ChatGPT’nin Gelişmiş Ses Modunu kullanıma sunmaya başladı ve kullanıcılara GPT-4o’nun hiper gerçekçi sesli yanıtlarına ilk erişimini sağladı. Alfa sürümü bugün küçük bir ChatGPT Plus kullanıcısı grubuna sunulacak ve OpenAI, özelliğin 2024 sonbaharında kademeli olarak tüm Plus kullanıcılarına sunulacağını söylüyor.
OpenAI, Mayıs ayında GPT-4o’nun sesini ilk kez gösterdiğinde, bu özellik hızlı yanıtları ve gerçek bir insan sesine esrarengiz benzerliğiyle (özellikle de bir insan sesi) izleyicileri şok etti. Sky’ın sesi, “Her” filmindeki yapay asistanın arkasındaki oyuncu Scarlett Johansson’un sesine benziyordu. OpenAI’nin demosundan kısa bir süre sonra Johansson, CEO Sam Altman’ın kendi sesini kullanması yönündeki birçok talebi reddettiğini ve GPT-4o’nun demosunu gördükten sonra kendisinin benzerliğini savunması için hukuk danışmanı tuttuğunu söyledi. OpenAI, Johansson’un sesini kullanmayı reddetti ancak daha sonra demosunda gösterilen sesi kaldırdı. Haziran ayında OpenAI, güvenlik önlemlerini iyileştirmek için Gelişmiş Ses Modunun yayınlanmasını erteleyeceğini açıklamıştı.
Bir ay sonra, bekleme sona erdi (bir nevi). OpenAI, Bahar Güncellemesi sırasında sergilenen video ve ekran paylaşımı özelliklerinin bu alfanın bir parçası olmayacağını ve “daha sonraki bir tarihte” başlatılacağını söylüyor. Herkesi hayrete düşüren GPT-4o demosu şimdilik yalnızca bir demo, ancak bazı premium kullanıcılar artık ChatGPT’nin orada gösterilen ses özelliğine erişebilecek.
ChatGPT artık konuşup dinleyebilir
Şu anda ChatGPT’de mevcut olan Ses Modunu zaten denemiş olabilirsiniz, ancak OpenAI, Gelişmiş Ses Modunun farklı olduğunu söylüyor. ChatGPT’nin eski ses çözümü üç ayrı model kullanıyordu: biri sesinizi metne dönüştürmek için, GPT-4 isteminizi işlemek için ve üçüncüsü ChatGPT metnini sese dönüştürmek için. Ancak GPT-4o çok modludur, bu görevleri yardımcı modellerin yardımı olmadan gerçekleştirebilir ve önemli ölçüde daha düşük gecikmeli konuşmalar yaratabilir. OpenAI ayrıca GPT-4o’nun sesinizdeki üzüntü, heyecan veya şarkı söyleme gibi duygusal tonlamaları algılayabildiğini iddia ediyor.
Bu pilotta ChatGPT Plus kullanıcıları, OpenAI’nin Gelişmiş Ses Modunun gerçekte ne kadar hiper gerçekçi olduğunu ilk elden görebilecekler. TechCrunch bu makaleyi yayınlamadan önce özelliği test edemedi ancak erişim sağladığımızda inceleyeceğiz.
OpenAI, kullanımını yakından izlemek için ChatGPT’nin yeni sesini kademeli olarak yayınladığını söylüyor. Alfa grubundaki kişiler ChatGPT uygulamasında bir uyarı alacak ve ardından uygulamanın nasıl kullanılacağına ilişkin talimatların yer aldığı bir e-posta alacak.
OpenAI’nin demosundan bu yana geçen aylarda şirket, GPT-4o’nun ses yeteneklerini 45 farklı dil konuşan 100’den fazla harici kırmızı ekip üyesiyle test ettiğini açıkladı. OpenAI, bu güvenlik çabalarıyla ilgili bir raporun Ağustos başında geleceğini söylüyor.
Şirket, Gelişmiş Ses Modunun, ChatGPT’nin ücretli ses aktörleriyle işbirliği içinde hazırlanan dört önceden ayarlanmış sesiyle (Juniper, Breeze, Cove ve Ember) sınırlı olacağını söylüyor. OpenAI’nin Mayıs demosunda gösterilen Sky sesi artık ChatGPT’de mevcut değil. OpenAI sözcüsü Lindsay McCallum, “ChatGPT, hem bireyler hem de tanınmış kişiler olmak üzere diğer insanların seslerini taklit edemez ve bu önceden ayarlanmış seslerden birinden farklı çıktıları engelleyecektir” diyor.
OpenAI derin sahte tartışmalardan kaçınmaya çalışıyor. Ocak ayında, yapay zeka girişimi ElevenLabs’ın ses klonlama teknolojisi, New Hampshire’daki ön seçmenleri aldatarak Başkan Biden’ı taklit etmek için kullanıldı.
OpenAI ayrıca müzik veya diğer telif hakkıyla korunan ses üretmeye yönelik belirli istekleri engellemek için yeni filtreler sunduğunu da söylüyor. Geçen yıl, yapay zeka şirketleri telif hakkı ihlali nedeniyle kendilerini yasal sorunlarla karşı karşıya bıraktı ve GPT-4o gibi ses modelleri, şikayette bulunabilecek yepyeni bir şirket kategorisinin ortaya çıkmasına neden oldu. Özellikle kavgalı bir geçmişe sahip olan ve halihazırda yapay zekalı şarkı yaratıcıları Suno ve Udio’ya dava açan plak şirketleri.
Kaynak: https://techcrunch.com/2024/07/30/openai-releases-chatgpts-super-realistic-voice-feature/