Midjourney, yapay zeka görselleri için tutarlı karakterler sunuyor

Özel bir ağ oluşturma, içgörü ve sohbet gecesi için 27 Mart’ta Boston’daki liderlere katılın. Davet et Burada.

Popüler AI görüntü oluşturma hizmeti Yolculuk ortası en sık istenen özelliklerinden birini devreye aldı: karakterleri yeni görüntülerde tutarlı bir şekilde yeniden oluşturma yeteneği.

Bu, bugüne kadar yapay zeka görüntü oluşturucuları için büyük bir sıkıntı oldu: doğası gereği çoğu yapay zeka görüntü oluşturucu, “difüzyon modelleri,” benzeri veya buna dayalı araçlar Stability AI’nin Stabil Difüzyon açık kaynaklı görüntü oluşturma algoritmasıkabaca, bir kullanıcı tarafından girilen metni alıp, devasa boyutlardaki benzer görüntülerden ve metin etiketlerinden öğrenildiği gibi, bu açıklamaya uyan bir görüntüyü piksel piksel bir araya getirmeye çalışarak çalışır. Milyonlarca insan tarafından oluşturulan görüntüden oluşan (ve tartışmalı) eğitim veri seti.

Üretken yapay zeka görüntüleri için tutarlı karakterler neden bu kadar güçlü ve yakalanması zor?

Ancak metin tabanlı büyük dil modellerinde (LLM) olduğu gibi OpenAI’nin ChatGPT’si veya Cohere’in yeni Command-R’siTüm üretken yapay zeka uygulamalarının sorunu, yanıtların tutarsızlığıdır: Yapay zeka, istem tekrarlansa veya aynı anahtar sözcüklerden bazıları kullanılsa bile kendisine girilen her bir istem için yeni bir şey üretir.

Bu, Midjourney örneğinde görseller gibi tamamen yeni içerik parçaları oluşturmak için harikadır. Peki ya bir filme, bir romana, bir çizgi romana, çizgi romana ya da istediğiniz başka bir görsel ortama storyboard yapıyorsanız? aynısı karakter veya karakterler bunun içinde hareket edecek ve farklı sahnelerde, ortamlarda, farklı yüz ifadeleri ve aksesuarlarla görünecek mi?

VB Etkinliği

Yapay Zeka Etki Turu – Boston

27 Mart’ta Boston’daki AI Etki Turunun bir sonraki durağı için heyecanlıyız. Microsoft ile ortaklaşa gerçekleştirilen bu özel, yalnızca davetle katılabileceğiniz etkinlikte, 2024 ve sonrasında veri bütünlüğüne yönelik en iyi uygulamalara ilişkin tartışmalar yer alacak. Kontenjan sınırlıdır, bu nedenle bugün bir davet isteyin.

Davet et

Tipik olarak anlatının sürekliliği için gerekli olan bu senaryoyu üretken yapay zeka ile başarmak şu ana kadar çok zor oldu. Ancak Midjourney şimdi bu konuda biraz deneme yapıyor ve kullanıcıların Midjourney Discord’daki metin istemlerinin sonuna ekleyebileceği yeni bir etiket olan “–cref” (“karakter referansı”nın kısaltması) tanıtıyor ve karakterin yüz ifadesini eşleştirmeye çalışacak. kullanıcının söz konusu etiketin altına yapıştırdığı bir URL’den özellikler, vücut tipi ve hatta kıyafetler.

Özellik ilerledikçe ve geliştirildikçe, Midjourney’i harika bir oyuncak veya fikir kaynağı olmaktan çıkarıp profesyonel bir araca dönüştürebilir.

Yeni Midjourney tutarlı karakter özelliği nasıl kullanılır?

Etiket, önceden oluşturulmuş Yolculuk Ortası görselleriyle en iyi şekilde çalışır. Dolayısıyla, örneğin bir kullanıcının iş akışı, önce önceden oluşturulmuş bir karakterin URL’sini oluşturmak veya almak olacaktır.

Sıfırdan başlayalım ve bu istemle yeni bir karakter oluşturduğumuzu varsayalım: “boncuklu ve göz bantlı, kaslı, kel bir adam.”