Adobe, video oluşturmak için bir yapay zeka modeli oluşturduğunu söylüyor. Ancak bu modelin tam olarak ne zaman piyasaya sürüleceği veya var olduğu gerçeği dışında pek bir şey açıklanmıyor.
OpenAI’nin Sora’sına, Google’ın Imagen 2’sine ve yeni ortaya çıkan üretken yapay zeka video alanındaki sayıları giderek artan startup modellerine bir tür yanıt olarak sunulan Adobe’nin modeli (şirketin genişleyen Firefly üretken yapay zeka ürünleri ailesinin bir parçası) yerini alacak. Adobe, Adobe’nin amiral gemisi video düzenleme paketi Premiere Pro’nun bu yılın sonlarında piyasaya çıkacağını söylüyor.
Günümüzün birçok üretken yapay zeka video aracı gibi, Adobe’nin modeli de sıfırdan görüntü oluşturuyor (ister istem ister referans görüntüler) — ve Premiere Pro’daki üç yeni özelliğe güç veriyor: nesne ekleme, nesne kaldırma ve üretken genişletme.
Oldukça açıklayıcıdırlar.
Nesne ekleme, kullanıcıların bir video klibin bir bölümünü (örneğin üstteki üçte birlik kısmı veya sol alt köşeyi) seçmesine ve bu bölüme nesneler eklemek için bir komut istemi girmesine olanak tanır. TechCrunch ile yapılan bir brifingde Adobe sözcüsü, Adobe’nin modeli tarafından oluşturulan elmaslarla dolu, gerçek dünyaya ait bir evrak çantasının hareketsiz görüntüsünü gösterdi.
Nesne kaldırma, çekimin arka planındaki mikrofon veya kahve fincanı gibi nesneleri kliplerden kaldırır.
Üretken genişletmeye gelince, bir klibin başına veya sonuna birkaç kare ekler (maalesef Adobe kaç kare olduğunu söylemez). Üretken genişletme, tüm sahneleri oluşturmak anlamına gelmez; bunun yerine, bir film müziği ile senkronize olmak veya örneğin duygusal ağırlık eklemek için ekstra bir vuruş için bir çekimi tutmak için tampon çerçeveleri eklemek anlamına gelir.
Adobe, bunun gibi üretken yapay zeka araçlarının etrafında kaçınılmaz olarak ortaya çıkan derin sahtekarlık korkularını gidermek için, Yapay Zeka tarafından oluşturulan medyayı tanımlayan meta veriler olan İçerik Kimlik Bilgilerini Premiere’e getirdiğini söylüyor. Adobe’nin İçerik Orijinallik Girişimi aracılığıyla desteklediği bir medya kaynak standardı olan İçerik Kimlik Bilgileri, Photoshop’ta zaten mevcuttu ve Adobe’nin görüntü üreten Firefly modellerinin bir bileşeniydi. Premiere’de yalnızca hangi içeriğin yapay zeka tarafından oluşturulduğunu değil, aynı zamanda onu oluşturmak için hangi yapay zeka modelinin kullanıldığını da gösterecekler.
Adobe’ye modeli eğitmek için hangi verilerin (resimler, videolar vb.) kullanıldığını sordum. Şirket, veri setine katkıda bulunanlara nasıl tazminat ödeyeceğini (veya ödeyip ödemeyeceğini) söylemedi veya söylemedi.
Geçtiğimiz hafta Bloomberg, konuya aşina kaynaklardan alıntı yaparak, Adobe’nin stok medya platformu Adobe Stock’taki fotoğrafçı ve sanatçılara, video oluşturma modelini eğitmek için kısa video klipler göndermeleri karşılığında 120 dolara kadar ödeme yaptığını bildirdi. Ödemenin, gönderime bağlı olarak video başına dakika başına yaklaşık 2,62 ABD Doları ile dakika başına yaklaşık 7,25 ABD Doları arasında değiştiği ve daha yüksek kaliteli görüntülerin buna bağlı olarak daha yüksek oranlara sahip olduğu söyleniyor.
Bu, Adobe’nin görüntü oluşturma modellerini eğitmek için çalışmalarını kullandığı Adobe Stock sanatçıları ve fotoğrafçılarıyla mevcut anlaşmasından bir sapma olacaktır. Şirket, katkıda bulunanlara, Stoktaki içeriğin hacmine ve nasıl kullanıldığına bağlı olarak tek seferlik bir ücret değil, yıllık bir bonus ödüyor; ancak bu, şeffaf olmayan bir formüle tabi olan ve yıldan yıla garanti edilmeyen bir bonus.
Bloomberg’in raporu, eğer doğruysa, modellerini eğitmek için YouTube’dan videolar da dahil olmak üzere kamuya açık web verilerini topladığı söylenen OpenAI gibi üretken AI video rakiplerinin yaklaşımıyla tam bir tezat oluşturan bir yaklaşımı tasvir ediyor. YouTube’un CEO’su Neal Mohan geçtiğimiz günlerde OpenAI’nin metinden videoya oluşturucusunu eğitmek için YouTube videolarının kullanılmasının platformun hizmet şartlarının ihlali olacağını söyledi ve OpenAI’nin ve diğerlerinin adil kullanım argümanının yasal zayıflığını vurguladı.
OpenAI’nin de aralarında bulunduğu şirketler, sahiplerine kredi veya ödeme vermeden, telif hakkıyla korunan içerik konusunda yapay zekalarını eğiterek fikri mülkiyet yasasını ihlal ettikleri iddiaları nedeniyle dava ediliyor. Adobe, bazen üretken yapay zeka rekabeti olan Shutterstock ve Getty Images (aynı zamanda model eğitim verilerinin lisanslanması için düzenlemelere de sahiptir) gibi bu sondan kaçınmaya niyetli görünüyor ve fikri mülkiyet tazminat politikasıyla kendisini şirketler için doğrulanabilir “güvenli” bir seçenek olarak konumlandırıyor. kurumsal müşteriler.
Ödeme konusunda Adobe, Premiere’in gelecek video oluşturma özelliklerini kullanmanın müşterilere ne kadara mal olacağını söylemiyor; muhtemelen fiyatlandırma hâlâ belirleniyor. Ama şirket yaptı ödeme planının ilk Firefly modelleriyle oluşturulan üretken kredi sistemini takip edeceğini ortaya koyuyor.
Adobe Creative Cloud’a ücretli aboneliği olan müşteriler için üretken krediler, plana bağlı olarak ayda 25 ila 1.000 arasında değişen paylarla her ay yenilenir. Daha karmaşık iş yükleri (örneğin, daha yüksek çözünürlükte oluşturulan görüntüler veya birden fazla görüntünün oluşturulması) genel bir kural olarak daha fazla kredi gerektirir.
Aklımdaki en büyük soru şu: Adobe’nin yapay zeka destekli video özellikleri değer sonuçta maliyeti ne kadar?
Firefly görüntü oluşturma modelleri şu ana kadar Midjourney, OpenAI’nin DALL-E 3 ve diğer rakip araçlarla karşılaştırıldığında yetersiz ve kusurlu olduğu gerekçesiyle geniş çapta alay konusu oldu. Video modelinde yayınlanma zaman diliminin olmayışı, aynı akıbetten kaçınılacağına dair pek fazla güven vermiyor. Adobe’nin bana nesne ekleme, nesne kaldırma ve üretken genişletmeyle ilgili canlı demolar göstermeyi reddetmesi ve bunun yerine önceden kaydedilmiş bir cızırtılı makara üzerinde ısrar etmesi de geçerli değil.
Adobe, belki de iddialarını güvence altına almak için üçüncü taraf satıcılarla video oluşturma modellerini Premiere’e entegre etme ve üretken genişletme gibi güç araçları ve daha fazlası konusunda görüşmelerde bulunduğunu söylüyor.
Bu satıcılardan biri OpenAI’dir.
Adobe, Sora’yı Premiere iş akışına getirme yolları konusunda OpenAI ile işbirliği yaptığını söylüyor. (Yapay zeka girişiminin yakın zamanda Hollywood’a yönelik teklifleri göz önüne alındığında OpenAI ortaklığı mantıklı; OpenAI CTO’su Mira Murati bu yıl Cannes Film Festivali’ne katılacak.) Diğer ilk ortaklar arasında video oluşturmak ve düzenlemek için yapay zeka araçları geliştiren bir girişim olan Pika yer alıyor. ve üretken video modeline sahip ilk satıcı pazarlarından biri olan Runway.
Bir Adobe sözcüsü, şirketin gelecekte başkalarıyla çalışmaya açık olacağını söyledi.
Şimdi, çok açık olmak gerekirse, bu entegrasyonlar şu anda çalışan bir üründen ziyade bir düşünce deneyidir. Adobe, müşterilerin yakın zamanda oynamayı bekleyebilecekleri bir şey değil, “erken önizleme” ve “araştırma” aşamasında olduklarını bana defalarca vurguladı.
Ve bunun Adobe’nin üretken video baskı makinesinin genel tonunu yakaladığını söyleyebilirim.
Adobe bu duyurularla, yalnızca ön anlamda da olsa, üretken video hakkında düşündüğünün sinyalini vermeye çalışıyor. Bunu yapmamak aptalca olurdu; üretken yapay zeka yarışında dümdüz yakalanmak, ekonominin sonunda Adobe’nin lehine sonuçlanacağını varsayarsak, değerli bir potansiyel yeni gelir akışını kaybetme riskiyle karşı karşıya kalmaktır. (Sonuçta yapay zeka modellerinin eğitilmesi, çalıştırılması ve hizmete sunulması maliyetlidir.)
Ancak gösterdiği şey (kavramlar) açıkçası çok da ilgi çekici değil. Sora’nın ortalıkta olması ve daha fazla yeniliğin yolda olması nedeniyle şirketin kanıtlaması gereken çok şey var.
Kaynak: https://techcrunch.com/2024/04/15/adobes-working-on-generative-video-too/