Adobe, yeni görüntü oluşturma modelinin şimdiye kadarki en iyisi olduğunu iddia ediyor

Adobe’nin üretken yapay zeka modelleri ailesi olan Firefly, yaratıcılar arasında pek iyi bir üne sahip değil.

Özellikle Firefly görüntü oluşturma modeli, Midjourney, OpenAI’nin DALL-E 3 ve diğer rakipleriyle karşılaştırıldığında, uzuvları ve manzaraları çarpıtma ve istemlerdeki nüansları kaçırma eğilimi nedeniyle yetersiz ve kusurlu olduğu için alay konusu oldu. Ancak Adobe, bu hafta şirketin Max London konferansı sırasında piyasaya sürülen üçüncü nesil modeli Firefly Image 3 ile durumu düzeltmeye çalışıyor.

Artık Photoshop (beta) ve Adobe’nin Firefly web uygulamasında mevcut olan model, daha uzun, daha karmaşık istemleri ve sahneleri anlama yeteneği sayesinde önceki modele (Resim 2) ve önceki modele (Resim 1) göre daha “gerçekçi” görüntüler üretiyor yanı sıra geliştirilmiş aydınlatma ve metin oluşturma yetenekleri. Adobe, tipografi, ikonografi, raster görseller ve çizgi sanatı gibi şeyleri daha doğru bir şekilde oluşturması gerektiğini ve yoğun kalabalıkları ve insanları “ayrıntılı özelliklerle” ve “çeşitli ruh halleri ve ifadelerle” tasvir etme konusunda “önemli ölçüde” daha becerikli olduğunu söylüyor.

Ne olursa olsun, bilimsel olmayan kısa testlerimde, Resim 3 yapmak Resim 2’den bir adım önde gibi görünüyor.

Resim 3’ü kendim deneyemedim. Ancak Adobe PR, modelden birkaç çıktı ve bilgi gönderdi ve ben de aynı istemleri, Görüntü 3 çıktılarını karşılaştıracak örnekler almak için web’deki Görüntü 2 aracılığıyla çalıştırmayı başardım. (Resim 3 çıktılarının isteğe göre seçilmiş olabileceğini unutmayın.)

Resim 3’teki bu vesikalık fotoğraftaki aydınlatmanın, Resim 2’deki altındaki ışıkla karşılaştırıldığında dikkat edin:

Image 3 çıktısı, Image 2 örneğinde büyük ölçüde bulunmayan gölgeleme ve kontrastla gözlerime daha ayrıntılı ve gerçekçi görünüyor.

İşte Resim 3’ün sahne anlayışını gösteren bir dizi resim:

Görüntü 2 örneğinin, ayrıntı düzeyi ve genel ifade gücü açısından Görüntü 3’ün çıktısıyla karşılaştırıldığında oldukça basit olduğunu unutmayın. Resim 3’teki numunenin gömleğinde (bel bölgesi civarında) öznede bir çarpıklık mevcut, ancak poz, deneğin Resim 2’deki pozundan daha karmaşık. (Ve Resim 2’nin kıyafetleri de biraz farklı.)

Image 3’teki gelişmelerin bir kısmı şüphesiz daha büyük ve daha çeşitli bir eğitim veri setine dayandırılabilir.

Resim 2 ve Resim 1 gibi Resim 3 de yüklemeler konusunda eğitilmiştir. Adobe Stock, Adobe’nin telifsiz medya kütüphanesi ve telif hakkı süresi dolmuş lisanslı ve kamu malı içerikle birlikte. Adobe Stock ve dolayısıyla mevcut eğitim veri seti de sürekli olarak büyüyor.

Davaları önlemek ve görüntüler üzerinde ayrım gözetmeksizin eğitim veren üretken yapay zeka satıcılarına (örn. OpenAI, Midjourney) karşı kendisini daha “etik” bir alternatif olarak konumlandırmak amacıyla Adobe, eğitim veri seti için Adobe Stock katılımcılarına ödeme yapacak bir programa sahiptir. (Ancak programın şartlarının oldukça şeffaf olduğunu belirteceğiz.) Tartışmalı bir şekilde Adobe, Firefly modellerini AI tarafından oluşturulan görüntüler üzerinde de eğitiyor ve bazıları bunu bir tür veri aklama olarak değerlendiriyor.

Son Bloomberg raporu, Adobe Stock’ta yapay zeka tarafından oluşturulan görüntülerin Firefly görüntü oluşturma modellerinin eğitim verilerinden hariç tutulmadığını ortaya çıkardı; bu görüntülerin, telif hakkıyla korunan materyaller içerebileceği göz önüne alındığında rahatsız edici bir olasılık. Adobe, AI tarafından oluşturulan görsellerin eğitim verilerinin yalnızca küçük bir bölümünü oluşturduğunu ve ticari markaları veya tanınabilir karakterleri tasvir etmediğinden veya sanatçıların adlarına atıfta bulunmadığından emin olmak için bir denetleme sürecinden geçtiğini iddia ederek bu uygulamayı savundu.

Elbette ne çeşitli, daha “etik” kaynaklı eğitim verileri ne de içerik filtreleri ve diğer korumalar kusursuz kusursuz bir deneyimi garanti etmez; bkz. kuşları uçuran insanlar Resim 2 ile. Resim 3’ün gerçek testi, topluluk onu ele geçirdiğinde gelecektir.

Yapay zeka destekli yeni özellikler

Image 3, Photoshop’ta geliştirilmiş metinden resme dönüştürmenin ötesinde birçok yeni özelliğe güç veriyor.

Resim 3’teki yeni “stil motoru” ve yeni otomatik stilizasyon düğmesi, modelin daha geniş bir renk, arka plan ve nesne pozu dizisi oluşturmasına olanak tanıyor. Kullanıcıların modeli, gelecekte oluşturulacak içeriğin renklerinin veya tonunun hizalanmasını istedikleri bir görüntüye göre koşullandırmasına olanak tanıyan bir seçenek olan Referans Görüntüsünü beslerler.

Üç yeni üretken araç – Arka Plan Oluştur, Benzer Oluştur ve Ayrıntıyı Geliştir – görüntüler üzerinde hassas düzenlemeler gerçekleştirmek için Görüntü 3’ten yararlanın. (Kendini tanımlayan) Arka Plan Oluştur, arka planı mevcut görüntüye uyum sağlayan oluşturulmuş bir arka planla değiştirirken Benzer Oluştur, fotoğrafın seçilen bir bölümünde (örneğin bir kişi veya bir nesne) varyasyonlar sunar. Ayrıntıyı Geliştirme özelliği, keskinliği ve netliği artırmak için görüntülere “ince ayar” yapar.

Bu özellikler tanıdık geliyorsa bunun nedeni Firefly web uygulamasında en az bir aydır (ve Midjourney’de bundan çok daha uzun süredir) beta sürümde olmalarıdır. Bu onların Photoshop’taki ilk çıkışını işaret ediyor — beta olarak.

Web uygulamasından bahsetmişken Adobe, AI araçlarına giden bu alternatif rotayı ihmal etmiyor.

Image 3’ün piyasaya sürülmesiyle aynı zamana denk gelen Firefly web uygulaması, Adobe’nin “yaratıcı kontrolü ilerletmenin” yeni yolları olarak sunduğu Yapı Referansı ve Stil Referansını alıyor. (Her ikisi de Mart ayında duyuruldu, ancak artık geniş çapta kullanılabilir hale geliyorlar.) Yapı Referansı ile kullanıcılar, bir referans görselinin “yapısına” (örneğin, bir yarış arabasının önden görünümü) uyan yeni görseller oluşturabilirler. Stil Referansı, esas olarak, bir hedef görüntünün stilini (örneğin kalem çizimi) taklit ederken bir görüntünün içeriğini (örneğin, Afrika Safarisindeki filler) koruyan, başka bir adla stil aktarımıdır.

İşte Yapı Referansı iş başında:

Ve Stil Referansı:

Adobe’ye, tüm yükseltmelerle birlikte Firefly görüntü oluşturma fiyatlandırmasının değişip değişmeyeceğini sordum. Şu anda en ucuz Firefly premium planı aylık 4,99 dolardır; Midjourney (ayda 10 dolar) ve OpenAI (ayda 20 dolarlık ChatGPT Plus aboneliğinin arkasında DALL-E 3’e kapı açan) gibi rekabeti altüst etmektedir.

Adobe, üretken kredi sistemiyle birlikte mevcut katmanlarının şimdilik aynı kalacağını söyledi. Ayrıca Adobe’nin Firefly’da oluşturulan eserlerle ilgili telif hakkı taleplerini ödeyeceğini belirten tazminat politikasının da değişmeyeceğini ve AI tarafından oluşturulan içeriğe filigran ekleme yaklaşımının da değişmeyeceğini söyledi. Yapay zeka tarafından oluşturulan medyayı tanımlayan meta veriler olan İçerik Kimlik Bilgileri, ister sıfırdan oluşturulmuş ister üretken özellikler kullanılarak kısmen düzenlenmiş olsun, web ve Photoshop’taki tüm Firefly görüntü nesillerine otomatik olarak eklenmeye devam edecek.

Kaynak: https://techcrunch.com/2024/04/23/adobe-claims-its-new-image-generation-model-is-its-best-yet/