Ses modu OpenAI’nin yeni teknolojisi tarafından desteklenmektedir GPT-4o Ses, metin ve görüntü yeteneklerini birleştiren model. Geri bildirim toplamak için şirket, başlangıçta chatbot’u ChatGPT Plus için ödeme yapan “küçük bir kullanıcı grubuna” sunacak, ancak botun bu sonbaharda tüm ChatGPT Plus abonelerinin kullanımına sunulacağını söylüyor. ChatGPT Plus aboneliğinin aylık maliyeti 20 ABD dolarıdır. OpenAI, ChatGPT uygulamasındaki ilk dağıtım dalgasının parçası olan müşterileri bilgilendireceğini ve yeni modelin nasıl kullanılacağına ilişkin talimatlar sağlayacağını söyledi.
Yeni ses özelliği, Mayıs ayında açıklandıbaşlangıçta planlanandan bir ay sonra piyasaya sürülüyor çünkü şirket dedi modelin istenmeyen içeriği algılama ve reddetme yeteneği gibi güvenlik özelliklerini geliştirmek için daha fazla zamana ihtiyacı vardı. Şirket ayrıca milyonlarca kullanıcıya gerçek zamanlı yanıtlar sunmak için altyapısını hazırladığını da söyledi.
OpenAI, modelin ses yeteneklerini, modeli kusurlara karşı araştırmakla görevlendirilen 100’den fazla harici kırmızı ekip üyesiyle test ettiğini söyledi. OpenAI’ye göre bu test uzmanları toplam 45 dil konuşuyordu ve 29 ülkeyi temsil ediyordu.
Şirket, çeşitli güvenlik mekanizmalarını uygulamaya koyduğunu söylüyor. Örneğin, modelin derin ses sahtekarlıkları oluşturmak için kullanılmasını önlemeyi amaçlayan bir hamleyle, seslendirme sanatçılarıyla işbirliği yaparak önceden ayarlanmış dört ses oluşturdu. GPT-4o başkalarının seslerini taklit etmeyecek veya seslerini üretmeyecektir.
OpenAI, GPT-4o’yu ilk kez piyasaya sürdüğünde şirket, aktris Scarlett Johansson’a çok benzeyen “Sky” adlı bir ses kullanması nedeniyle tepkiyle karşılaştı. Johansson bir yayınladı ifade Şirketin model için sesini kullanma izni almak için kendisine ulaştığını ancak kendisinin reddettiğini söyledi. Modelin demosunda kendi sesine “ürkütücü derecede benzeyen” bir ses duyduğunda şok olduğunu söyledi. OpenAI’nin sahip olduğu reddedildi sesin Johansson’a ait olduğunu ancak Sky’ın kullanımını durdurduğunu söyledi.
Şirket aynı zamanda telif hakkı ihlali iddialarıyla ilgili çeşitli davalarla da karşı karşıya bulunuyor. OpenAI, müzik veya diğer telif hakkıyla korunan ses üretme isteklerini tanıyan ve engelleyen filtreler benimsediğini söylüyor. OpenAI ayrıca metin tabanlı modelinde kullandığı güvenlik mekanizmalarının aynısını GPT-4o’nun yasaları çiğnemesini ve zararlı içerik üretmesini önlemek için uyguladığını da söylüyor.
OpenAI, ilerleyen süreçte asistanı daha kullanışlı hale getirebilecek video ve ekran paylaşımı gibi daha gelişmiş özellikler eklemeyi planlıyor. Mayıs demosunda çalışanlar telefon kameralarını bir kağıt parçasına doğrulttular ve yapay zeka modelinden matematik denklemlerini çözmelerine yardımcı olmasını istediler. Ayrıca bilgisayar ekranlarını da paylaşarak modelden kodlama problemlerini çözmelerine yardımcı olmasını istediler. OpenAI, bu özelliklerin şu anda kullanılamayacağını ancak belirtilmeyen daha sonraki bir tarihte kullanılabileceğini söylüyor.
Kaynak: https://www.technologyreview.com/2024/07/30/1095489/openai-has-released-a-new-chatgpt-bot-that-you-can-talk-to/