Stability AI, daha tutarlı AI videoları için bir yayılma modeli olan SVD 1.1’i piyasaya sürüyor

Kararlılık Yapay Zekasıİçerik oluşturma ve kodlamaya yönelik giderek artan açık kaynak yapay zeka modelleri dizisiyle tanınan şirket, bugün görüntüden videoya gizli yayılma modeli Stable Video Diffusion (SVD) için bir yükseltme yaptığını duyurdu.

SVD 1.1 olarak adlandırılan güncellenmiş model, SVD 1.0’ın ince ayarlı bir versiyonu olup, daha iyi hareket ve daha fazla tutarlılığa sahip kısa yapay zeka videoları oluşturmak için optimize edilmiştir.

Yükseltmeyi duyuran bir gönderide Stability AI CTO’su Tom Mason, yeni modelin genel kullanıma açık olduğunu ve şu adresten indirilebileceğini doğruladı: Sarılma Yüz.

Ayrıca modelin bir parçası olarak sağlanacağını da kaydetti. Stabilitenin abonelik üyelikleriBireysel ve kurumsal kullanıcılar için ücretsiz, ayda 20 ABD Doları ve üzeri olmak üzere farklı katmanlara sahip. Yeni SVD 1.1’i ticari amaçlarla dağıtmak isteyen kullanıcıların üyelik almaları gerekecek.

VB Etkinliği

Yapay Zeka Etki Turu – NYC

Yapay zeka uygulamalarının risklerini ve getirilerini nasıl dengeleyeceğimizi tartışmak üzere Microsoft ile ortaklaşa 29 Şubat’ta New York’ta olacağız. Aşağıdaki özel etkinliğe davet isteyin.

Davet et

Ancak araştırma amaçlı kullanıma açık ve ücretsiz olmaya devam ediyor.

Stability AI’nin SVD 1.1’inden neler beklenebilir?

Kasım 2023’te Stability, yapay zeka videoları için iki modeli piyasaya sürdü: SVD ve SVD-XT. İlki, koşullandırma çerçevesi olarak hareketsiz bir görüntüyü alan ve ondan 14 kareye kadar dört saniyelik bir video üreten temel modeldi. Bu arada ikincisi, aynı şekilde çalışan ancak 25 kareye kadar üreten ince ayarlı versiyondu.

Artık SVD-XT’de ince ayar yapan Stability, SVD 1.1’i piyasaya sürdü. Şirket, bu modelin ayrıca 25 karelik, ancak aynı boyuttaki bir bağlam çerçevesi göz önüne alındığında 1024×576 çözünürlükte dört saniyelik videolar ürettiğini söylüyor.

Daha da önemlisi, bu yükseltmenin orijinal modelle karşılaştırıldığında daha tutarlı video çıkışları sunması bekleniyor.

Örneğin, birçok durumda SVD ve SVD-XT, fotogerçekçilik sağlamayı kaçırır, hareketsiz veya çok yavaş kamera kaydırmalarıyla videolar oluşturur ve kullanıcıların beklediği gibi yüzleri ve insanları oluşturmada başarısız olur. Çıkışlarda daha iyi hareket elde etmeyi vaat eden SVD 1.1 ile tüm bunların ortadan kalkması bekleniyor.

“Hiperparametreleri ayarlamaya gerek kalmadan çıktıların tutarlılığını artırmak için 6FPS’de sabit koşullandırma ve hareket kümesi kimliği 127 ile ince ayar (SVD 1.1 için) yapıldı. Bu koşullar hala ayarlanabilir ve kaldırılmamıştır. Sabit koşullandırma ayarlarının dışındaki performans, SVD 1.0 ile karşılaştırıldığında farklılık gösterebilir,” diye belirtiyor şirket, yeni modun Hugging Face sayfasında.

Gerçek AI videoları görülmeye devam ediyor

Stabilite, SVD 1.1 ile performansın arttığını iddia etse de pratikte tam olarak nasıl çalışacağı henüz bilinmiyor. Modelin Hugging Face sayfası, bunun araştırma amaçlı olduğunu belirtiyor ve aynı zamanda bazı orijinal sorunların hala ortaya çıkabileceği konusunda uyarıyor.

Özellikle Sarılma Yüzüne ek olarak Stabil Video Dağıtım modelleri de şu şekilde kullanılabilir: API, Stability AI geliştirici platformunda mevcuttur. Bu, geliştiricilere gelişmiş video oluşturmayı ürünlerine sorunsuz bir şekilde entegre etmeleri için kolay bir yol sağlar.

“…oluşturulan 25 kare ve kalan enterpolasyonlu kareler dahil olmak üzere MP4 formatında 24 fps’de 4 saniyelik video üreten Stabil Video Dağıtım API’sini piyasaya sürdük. Mason, gönderisinde, hareket gücü kontrolünü ve 1024×576, 768×768 ve 576×1024 dahil olmak üzere çoklu düzenleri ve çözünürlükleri destekliyoruz” dedi.

Geçtiğimiz yıl Stability AI, sık sık model yayınlayarak üretken yapay zeka konusunda çıtayı zorladı. 2024 yılı da aynı şekilde ilerleyecek gibi görünüyor. Şirket 2019 yılında kuruldu ve önemli miktarda fon topladı. 101 milyon dolarlık bir tur 2022’de duyuruldu. Ancak bu alanda faaliyet gösteren tek şirket o değil. Runway’den rekabetçi teklifler ve Pika özellikle yalnızca video oluşturmakla kalmayıp aynı zamanda bunları kolaylıkla kişiselleştirme ve yükseltme seçenekleri de sunan, müşteriye yönelik web platformlarıyla da ilgi kazandı.

Yakın zamanda rakip Runway çıkış yaptı Çok Hareketli Fırça platformunda, kullanıcıların AI videolarının belirli bölümlerine hareket eklemesine olanak tanıyor. Başka bir AI video oluşturma şirketi, Pika, kullanıcıların, bir ineğin yüzünü bir ördeğin yüzüyle değiştirmek gibi, videolarındaki belirli bölgeleri değiştirmesine olanak tanır. Ancak her iki platform da modellerini API’ler aracılığıyla sunmuyor, bu da geliştiricilerin bunları kendi uygulamalarına entegre etmelerini engelliyor.

VentureBeat’in misyonu teknik karar vericilerin dönüştürücü kurumsal teknoloji hakkında bilgi edinmeleri ve işlem yapmaları için dijital bir şehir meydanı olmaktır. Brifinglerimizi keşfedin.

Kaynak: https://venturebeat.com/ai/stability-ai-launches-svd-1-1-a-diffusion-model-for-more-consistent-ai-videos/