Yapay zeka tarafından oluşturulan yüksek kaliteli videolara yönelik yarış kızışıyor.
Pazartesi günü, film ve görüntü içeriği yaratıcılarına yönelik üretken yapay zeka araçları geliştiren bir şirket olan Runway, Gen-3 Alpha’yı tanıttı. Şirketin en yeni yapay zeka modeli, metin açıklamalarından ve hareketsiz görüntülerden video klipler oluşturuyor. Runway, modelin, Runway’in önceki amiral gemisi video modeli Gen-2’ye göre üretim hızında ve kalitesinde “büyük” bir gelişme sağladığını ve ayrıca oluşturduğu videoların yapısı, stili ve hareketi üzerinde ayrıntılı kontroller sağladığını söylüyor.
Gen-3 önümüzdeki günlerde kurumsal müşteriler ve Runway’in yaratıcı iş ortakları programındaki şirketler de dahil olmak üzere Runway abonelerine sunulacak.
Runway, blogundaki bir gönderide şöyle yazıyor: “Gen-3 Alpha, geniş bir yelpazedeki eylemler, jestler ve duygularla etkileyici insan karakterleri oluşturmada başarılı.” “Çok çeşitli stilleri ve sinema terminolojisini yorumlamak için tasarlandı [and enable] yaratıcı geçişler ve sahnedeki öğelerin hassas ana çerçevelemesi.”
Gen-3 Alpha’nın sınırlamaları var, belki de en bariz olanı görüntülerin maksimum 10 saniyede dolması. Bununla birlikte, Runway kurucu ortağı Anastasis Germanidis, Gen-3’ün, yükseltilmiş altyapı üzerine eğitilmiş yeni nesil model ailesinde yer alan çeşitli video oluşturma modellerinden yalnızca ilki ve en küçüğü olduğunu vaat ediyor.
Germanidis bu sabah TechCrunch’a verdiği bir röportajda “Model karmaşık karakter ve nesne etkileşimleriyle mücadele edebilir ve nesiller her zaman fizik kanunlarını tam olarak takip etmez” dedi. “Bu ilk dağıtım, Gen-2’ye göre gözle görülür derecede daha hızlı üretim süreleriyle 5 ve 10 saniyelik yüksek çözünürlüklü nesilleri destekleyecek. 5 saniyelik bir klibin oluşturulması 45 saniye sürüyor, 10 saniyelik bir klibin oluşturulması ise 90 saniye sürüyor.”
Tüm video oluşturma modelleri gibi Gen-3 Alpha da çok sayıda video ve görüntü örneği üzerinde eğitildi, böylece yeni klipler oluşturmak için bu örneklerdeki kalıpları “öğrenebildi”. Eğitim verileri nereden geldi? Pist bunu söylemez. Bugünlerde az sayıda üretken yapay zeka sağlayıcısı bu tür bilgileri gönüllü olarak veriyor, bunun nedeni kısmen eğitim verilerini rekabet avantajı olarak görmeleri ve dolayısıyla bu verileri ve onunla ilgili bilgileri gizli tutmaları.
Germanidis, “Tüm eğitimlerimizi denetleyen kurum içi bir araştırma ekibimiz var ve modellerimizi eğitmek için seçilmiş, dahili veri kümelerini kullanıyoruz” dedi.
Satıcının web’deki telif hakkıyla korunan veriler de dahil olmak üzere kamuya açık veriler üzerinde eğitim alması durumunda, eğitim verileri ayrıntıları aynı zamanda fikri mülkiyetle ilgili davaların potansiyel bir kaynağıdır ve bu da daha fazlasının ifşa edilmesine yönelik başka bir caydırıcıdır. Mahkemelerde görülen bazı davalar, üretken yapay zeka araçlarının sanatçıların stillerini sanatçıların izni olmadan kopyaladığını ve kullanıcıların, sanatçıların hiçbir ödeme almadığı, sanatçıların orijinallerine benzeyen yeni çalışmalar üretmesine izin verdiğini ileri sürerek satıcıların adil kullanım eğitimi veri savunmalarını reddediyor.
Runway, modelin geliştirilmesinde sanatçılara danışıldığını söyleyerek telif hakkı konusuna biraz değindi. (Hangi sanatçılar? Net değil.) Bu, Germanidis’in 2023’te TechCrunch’ın Disrupt konferansında şömine başında bana söylediklerini yansıtıyor:
“Bunu ele almak için en iyi yaklaşımların neler olduğunu bulmak için sanatçılarla yakın işbirliği içinde çalışıyoruz” dedi. “Daha da büyüyebilmek ve yeni nesil modeller oluşturabilmek için çeşitli veri ortaklıklarını araştırıyoruz.”
Runway ayrıca, Runway’in hizmet şartlarına uymayan, telif hakkıyla korunan görsellerden ve içerikten video oluşturma girişimlerini engellemek için bir denetleme sistemi de dahil olmak üzere yeni bir dizi güvenlik önlemi ile Gen-3’ü piyasaya sürmeyi planladığını söylüyor. Ayrıca, videoların Gen-3’ten geldiğini belirlemek için Microsoft, Adobe, OpenAI ve diğerleri tarafından desteklenen C2PA standardıyla uyumlu bir kaynak sistemi de üzerinde çalışılıyor.
Germanidis, “Yeni ve geliştirilmiş şirket içi görsel ve metin denetleme sistemimiz, uygunsuz veya zararlı içeriği filtrelemek için otomatik gözetim kullanıyor” dedi. “C2PA kimlik doğrulaması, tüm Gen-3 modelleriyle oluşturulan medyanın kaynağını ve orijinalliğini doğruluyor. Model yetenekleri ve yüksek kaliteli içerik üretme yeteneği arttıkça, hizalama ve güvenlik çabalarımıza önemli ölçüde yatırım yapmaya devam edeceğiz.”
Runway ayrıca, “belirli sanatsal ve anlatısal gereksinimleri” hedef alarak daha “üslup açısından kontrollü” ve tutarlı karakterlere izin veren 3. Nesil’in özel versiyonlarını oluşturmak için “önde gelen eğlence ve medya kuruluşlarıyla” ortaklık kurduğunu ve işbirliği yaptığını da açıkladı. Şirket şunları ekliyor: “Bu, oluşturulan karakterlerin, arka planların ve öğelerin çeşitli sahnelerde tutarlı bir görünüm ve davranışı koruyabileceği anlamına geliyor.”
Video oluşturma modelleriyle ilgili çözülmemiş büyük bir sorun, kontroldür; yani yaratıcının sanatsal niyetleriyle uyumlu, tutarlı video oluşturacak bir modelin elde edilmesidir. Meslektaşım Devin Coldewey’in geçenlerde yazdığı gibi, geleneksel film yapımında bir karakterin kıyafetinde renk seçmek gibi basit meseleler, her çekim diğerlerinden bağımsız olarak yaratıldığı için üretken modellerle geçici çözümler gerektirir. Bazen geçici çözümler bile işe yaramaz; editörlere kapsamlı manuel iş kalır.
Runway, Google (bulut bilgi işlem kredisine sahip olduğu) ve Nvidia’nın yanı sıra Amplify Partners, Felicis ve Coatue gibi risk sermayedarları da dahil olmak üzere yatırımcılardan 236,5 milyon doların üzerinde para topladı. Şirket, üretken yapay zeka teknolojisine yaptığı yatırımlar arttıkça kendisini yaratıcı sektörle yakın bir şekilde uyumlu hale getiriyor. Runway, kurumsal müşteriler için prodüksiyon ortağı olarak hizmet veren bir eğlence bölümü olan Runway Studios’u işletiyor ve tamamen veya kısmen yapay zeka tarafından üretilen filmlerin sergilenmesine adanmış ilk etkinliklerden biri olan Yapay Zeka Film Festivali’ne ev sahipliği yapıyor.
Ama rekabet giderek kızışıyor.
Üretken yapay zeka girişimi Luma geçen hafta, memleri canlandırma yeteneğiyle viral hale gelen bir video oluşturucu olan Dream Machine’i duyurdu. Ve sadece birkaç ay önce Adobe, Adobe Stock medya kütüphanesindeki içerik üzerine eğitilmiş kendi video oluşturma modelini geliştirdiğini açıkladı.
Başka yerlerde, OpenAI’nin Sora gibi sıkı güvenlik önlemlerini koruyan, ancak OpenAI’nin pazarlama ajansları, bağımsız yapımcılar ve Hollywood film yönetmenleriyle tohumladığı yerleşik şirketler var. (OpenAI CTO’su Mira Murati, 2024 Cannes Film Festivali’ne katıldı.) AI araçları kullanılarak yapılan filmlerin küratörlüğünü yapmak için Runway ile de ortaklığı bulunan bu yılki Tribeca Festivali’nde, erken erişim hakkı verilen yönetmenler tarafından Sora ile üretilen kısa filmler yer aldı.
Google ayrıca, Veo’yu YouTube Shorts gibi ürünlere taşımak için çalışırken, görüntü oluşturma modeli Veo’yu aralarında Donald Glover (diğer adıyla Childish Gambino) ve yaratıcı ajansı Gilga’nın da bulunduğu seçkin içerik oluşturucuların kullanımına sundu.
Çeşitli işbirlikleri sarsılsa da, bir şey netleşiyor: Üretken yapay zeka video araçları, bildiğimiz film ve TV endüstrisini altüst etme tehdidinde bulunuyor.
Film yapımcısı Tyler Perry kısa süre önce Sora’nın neler yapabileceğini gördükten sonra yapım stüdyosunu 800 milyon dolarlık genişletme planını askıya aldığını söyledi. “Avengers: Endgame” gibi popüler Marvel filmlerinin yönetmeni Joe Russo, yapay zekanın bir yıl içinde tam teşekküllü bir film yaratabileceğini öngörüyor.
Hollywood animatörlerini ve karikatüristlerini temsil eden bir sendika olan Animation Guild tarafından 2024 yılında yaptırılan bir araştırma, yapay zekayı benimseyen film yapım şirketlerinin %75’inin teknolojiyi bünyesine kattıktan sonra işleri azalttığını, birleştirdiğini veya ortadan kaldırdığını ortaya çıkardı. Çalışma aynı zamanda 2026 yılına kadar ABD’de 100.000’den fazla eğlence işinin üretken yapay zeka nedeniyle sekteye uğrayacağını tahmin ediyor.
Video oluşturma araçlarının diğer üretken yapay zeka teknolojilerinin izinden gitmemesini ve yaratıcı çalışmaya olan talepte keskin düşüşlere yol açmamasını sağlamak için bazı ciddi işgücü korumaları gerekecek.
Kaynak: https://techcrunch.com/2024/06/17/runways-new-video-generating-ai-gen-3-offers-improved-controls/