Özel bir ağ oluşturma, içgörü ve sohbet gecesi için 27 Mart’ta Boston’daki liderlere katılın. Davet et Burada.
Popüler AI görüntü oluşturma hizmeti Yolculuk ortası en sık istenen özelliklerinden birini devreye aldı: karakterleri yeni görüntülerde tutarlı bir şekilde yeniden oluşturma yeteneği.
Bu, bugüne kadar yapay zeka görüntü oluşturucuları için büyük bir sıkıntı oldu: doğası gereği çoğu yapay zeka görüntü oluşturucu, “difüzyon modelleri,” benzeri veya buna dayalı araçlar Stability AI’nin Stabil Difüzyon açık kaynaklı görüntü oluşturma algoritmasıkabaca, bir kullanıcı tarafından girilen metni alıp, devasa boyutlardaki benzer görüntülerden ve metin etiketlerinden öğrenildiği gibi, bu açıklamaya uyan bir görüntüyü piksel piksel bir araya getirmeye çalışarak çalışır. Milyonlarca insan tarafından oluşturulan görüntüden oluşan (ve tartışmalı) eğitim veri seti.
Üretken yapay zeka görüntüleri için tutarlı karakterler neden bu kadar güçlü ve yakalanması zor?
Ancak metin tabanlı büyük dil modellerinde (LLM) olduğu gibi OpenAI’nin ChatGPT’si veya Cohere’in yeni Command-R’siTüm üretken yapay zeka uygulamalarının sorunu, yanıtların tutarsızlığıdır: Yapay zeka, istem tekrarlansa veya aynı anahtar sözcüklerden bazıları kullanılsa bile kendisine girilen her bir istem için yeni bir şey üretir.
Bu, Midjourney örneğinde görseller gibi tamamen yeni içerik parçaları oluşturmak için harikadır. Peki ya bir filme, bir romana, bir çizgi romana, çizgi romana ya da istediğiniz başka bir görsel ortama storyboard yapıyorsanız? aynısı karakter veya karakterler bunun içinde hareket edecek ve farklı sahnelerde, ortamlarda, farklı yüz ifadeleri ve aksesuarlarla görünecek mi?
Tipik olarak anlatının sürekliliği için gerekli olan bu senaryoyu üretken yapay zeka ile başarmak şu ana kadar çok zor oldu. Ancak Midjourney şimdi bu konuda biraz deneme yapıyor ve kullanıcıların Midjourney Discord’daki metin istemlerinin sonuna ekleyebileceği yeni bir etiket olan “–cref” (“karakter referansı”nın kısaltması) tanıtıyor ve karakterin yüz ifadesini eşleştirmeye çalışacak. kullanıcının söz konusu etiketin altına yapıştırdığı bir URL’den özellikler, vücut tipi ve hatta kıyafetler.
Özellik ilerledikçe ve geliştirildikçe, Midjourney’i harika bir oyuncak veya fikir kaynağı olmaktan çıkarıp profesyonel bir araca dönüştürebilir.
Yeni Midjourney tutarlı karakter özelliği nasıl kullanılır?
Etiket, önceden oluşturulmuş Yolculuk Ortası görselleriyle en iyi şekilde çalışır. Dolayısıyla, örneğin bir kullanıcının iş akışı, önce önceden oluşturulmuş bir karakterin URL’sini oluşturmak veya almak olacaktır.
Sıfırdan başlayalım ve bu istemle yeni bir karakter oluşturduğumuzu varsayalım: “boncuklu ve göz bantlı, kaslı, kel bir adam.”
En beğendiğimiz görselin ölçeğini yükselteceğiz, ardından Midjourney Discord sunucusunda “bağlantıyı kopyala” seçeneğini bulmak için kontrol tuşuna basarak tıklayacağız.
Ardından, “villada duran beyaz bir smokin giymek –cref” şeklinde yeni bir komut yazabiliriz. [URL]” yazın ve az önce oluşturduğumuz görüntünün URL’sini yapıştırın; Midjourney, yeni yazdığımız ayarda daha önce aynı karakteri oluşturmaya çalışacaktır.
Göreceğiniz gibi, sonuçlar orijinal karakterden (veya hatta orijinal istemimizden) tam olarak uzaktır, ancak kesinlikle cesaret vericidir.
Buna ek olarak, kullanıcı, yeni istemin sonuna “–cw” etiketini ve ardından 1’den 100’e kadar bir rakamı uygulayarak yeni görüntünün orijinal karakteri ne kadar yakından yeniden ürettiğinin “ağırlığını” bir dereceye kadar kontrol edebilir (” –cref [URL]” dizesi şöyle: “–cref [URL] –cw 100.” “Cw” sayısı ne kadar düşük olursa, ortaya çıkan görüntünün varyansı da o kadar fazla olur. “Cw” numarası ne kadar yüksek olursa, ortaya çıkan yeni görüntü orijinal referansı o kadar yakından takip edecektir.
Örneğimizde görebileceğiniz gibi, çok düşük bir “cw 8” girmek aslında istediğimiz şeyi verir: beyaz smokin. Gerçi artık karakterimizin ayırt edici göz bandı kaldırıldı.
Eh, biraz “bölgesel değişiklik” yapmanın çözemeyeceği hiçbir şey yok – değil mi?
Tamam, göz bandı yanlış göze takılmış… ama oraya varıyoruz!
Ayrıca, ilgili URL’lerle birlikte iki “–cref” etiketini yan yana kullanarak birden fazla karakteri tek bir karakterde birleştirebilirsiniz.
Bu özellik bu akşam erken saatlerde yayına girdi ancak sanatçılar ve yaratıcılar şimdiden onu test ediyor. Midjourney’iniz varsa kendiniz deneyin. Kurucu David Holz’un konuyla ilgili tam notunu aşağıda okuyun:
Hey @herkes @burada bugün yeni bir “Karakter Referansı” özelliğini test ediyoruz. Bu, “Stil Referansı” özelliğine benzer, ancak bir referans stiliyle eşleştirmek yerine karakterin bir “Karakter Referansı” görüntüsüyle eşleşmesini sağlamaya çalışır. Nasıl çalışır
- Tip
--cref URL
bir karakterin resminin URL’sini içeren isteminizden sonra - Kullanabilirsiniz
--cw
referans ‘gücünü’ 100’den 0’a değiştirmek için - güç 100 (
--cw 100
) varsayılandır ve yüzü, saçı ve kıyafetleri kullanır - 0 gücünde (
--cw 0
) sadece yüze odaklanacaktır (kıyafet / saç vb. değiştirmek için iyidir)
Ne anlama geliyor?
- Bu özellik, Yolculuk Ortası görüntülerinden oluşturulan karakterleri kullanırken en iyi sonucu verir. Gerçek kişiler/fotoğraflar için tasarlanmamıştır (ve normal görüntü istemlerinin yaptığı gibi muhtemelen bunları bozacaktır)
- Cref, karakter özelliklerine ‘odaklanması’ dışında normal görüntü istemlerine benzer şekilde çalışır
- Bu tekniğin kesinliği sınırlıdır; çukurları/çilleri/veya tişört logolarını tam olarak kopyalamaz.
- Cref, hem Niji hem de normal MJ modelleri için çalışır ve ayrıca aşağıdakilerle birleştirilebilir:
--sref
Gelişmiş özellikler
- Bunun gibi birden fazla resimdeki bilgileri/karakterleri karıştırmak için birden fazla URL kullanabilirsiniz
--cref URL1 URL2
(bu, birden fazla resim veya stil istemine benzer)
Web alfa’da nasıl çalışır?
- Bir görüntüyü hayal çubuğuna sürükleyin veya yapıştırın; artık üç simgeye sahiptir. ister bir görüntü istemi, ister bir stil referansı, ister bir karakter referansı olsun, bu kümeleri seçmek. Bir görseli birden fazla kategoride kullanmak için Shift tuşunu basılı tutarak bir seçenek belirleyin
MJ V6 alfa aşamasındayken bu ve diğer özelliklerin aniden değişebileceğini ancak V6’nın resmi beta sürümünün yakında geleceğini unutmayın. Fikirler ve özellikler konusunda herkesin düşüncelerini almak isteriz. Bu erken sürümü beğeneceğinizi ve hikayeler ve dünyalar inşa ederken oynamanıza yardımcı olacağını umuyoruz.
VentureBeat’in misyonu teknik karar vericilerin dönüştürücü kurumsal teknoloji hakkında bilgi edinmeleri ve işlem yapmaları için dijital bir şehir meydanı olmaktır. Brifinglerimizi keşfedin.
Kaynak: https://venturebeat.com/ai/midjourney-debuts-feature-for-generating-consistent-characters-across-multiple-gen-ai-images/