“Çok etkileyici. Synthesia’nın çalışmalarında yer almayan Bath Üniversitesi’nden araştırmacı Jack Saunders, “Başka hiç kimse bunu yapamaz” diyor.
Önizlediği tam vücut avatarlarının, zaman zaman ellerin birbirini “kesmesi” gibi küçük hatalara rağmen çok iyi olduğunu söylüyor. Ancak Saunders, “Muhtemelen bunu fark etmek için o kadar yakından bakmayacaksınız” diyor.
Sentez hipergerçekçi yapay zeka avatarlarının ilk versiyonunu piyasaya sürdü, deepfake olarak da bilinir, Nisan ayında. Bu avatarlar, ifadeleri ve ses tonunu konuşulan metnin duygusuyla eşleştirmek için büyük dil modelleri kullanır. Görüntü ve video üreten yapay zeka sistemlerinde kullanılan yayılma modelleri, avatarın görünümünü oluşturur. Ancak bu nesildeki avatarlar yalnızca gövdeden yukarı doğru görünüyor ve bu da etkileyici gerçekçiliği gölgede bırakabiliyor.
Tam vücut avatarları oluşturmak için Synthesia daha da büyük bir yapay zeka modeli oluşturuyor. Kullanıcıların vücut hareketlerini kaydetmek için bir stüdyoya gitmeleri gerekecek.
Ancak bu tam vücut avatarları kullanıma sunulmadan önce şirket, yapay zeka avatarlarının elleri olan ve birçok açıdan çekilebilen başka bir versiyonunu piyasaya sürüyor. Önceki modeller yalnızca portre modunda mevcuttu ve yalnızca önden görülebiliyordu.
Hour One gibi diğer girişimler de faaliyete geçti elleriyle benzer avatarlar. Bir araştırma önizlemesinde test ettiğim ve Temmuz ayı sonlarında piyasaya sürülecek olan Synthesia versiyonu biraz daha gerçekçi el hareketlerine ve dudak senkronizasyonuna sahip.
En önemlisi, gelecek güncelleme aynı zamanda kendi kişiselleştirilmiş avatarınızı oluşturmanızı da çok daha kolay hale getirecek. Şirketin önceki özel yapay zeka avatarları, kullanıcıların birkaç saat içinde yüzlerini ve seslerini kaydetmek için bir stüdyoya gitmelerini gerektiriyordu. Nisan ayında bildirdim.
Bu kez ihtiyaç duyulan materyali Synthesia ofisinde dijital kamera, yaka mikrofonu ve dizüstü bilgisayar kullanarak sadece 10 dakikada kaydettim. Ancak dizüstü bilgisayar kamerası gibi daha basit bir kurulum da işe yarayacaktır. Daha önce yüz hareketlerimi ve sesimi ayrı ayrı kaydetmek zorundayken bu sefer veriler aynı anda toplandı. Süreç aynı zamanda bu şekilde kaydedilmeye rıza gösteren bir komut dosyasının okunmasını ve rastgele oluşturulmuş bir güvenlik şifresinin okunmasını da içerir.
Kaynak: https://www.technologyreview.com/2024/06/24/1094170/synthesias-hyperrealistic-deepfakes-will-soon-have-full-bodies/