Sektör lideri yapay zeka kapsamına ilişkin en son güncellemeler ve özel içerik için günlük ve haftalık bültenlerimize katılın. Daha fazla bilgi edin
Hatırlamak Konuşmaya Dayalı Yapay Zeka? Tokyo merkezli girişim neredeyse bir yıl önce bir AI sahnesinde çarpıcı görünüm Google’dan yüksek profilli kurucuları ve yüksek performanslı modeller geliştirmeye yönelik yeni, otomatik birleştirme tabanlı yaklaşımıyla. Bugün şirket iki yeni görüntü oluşturma modelini duyurdu: Evo-Ukiyoe ve Evo-Nishikie.
Hugging Face’te mevcut olan modeller, metin ve görsel yönlendirmelerden görseller oluşturacak şekilde tasarlandı. Ancak ilginç ve benzersiz bir durum var: Farklı tarzlarda düzenli görüntü oluşturmayı ele almak yerine, bu modeller Japonya’nın popüler tarihi sanat formu ukiyo-e’ye lazer odaklıdır. 17. ve 19. yüzyıllar arasında gelişti ve Sakana, yapay zekanın gücünü kullanarak onu modern içerik tüketicilerine geri getirmeyi umuyor.
Bu hareket, yapay zeka alanındaki en son yerelleştirme çabası olarak geliyor; bu, geçtiğimiz yıl içinde aşağıdaki ülkelerdeki şirketlerle birlikte büyüyen bir şey: Güney Kore, Hindistan Ve Çin kendi kültürlerine ve lehçelerine göre uyarlanmış modeller oluşturmak.
Yeni Sakana AI modellerinden neler beklenebilir?
Geçmişi 1600’lerin başlarına dayanan Ukiyo-e – ya da “yüzen dünyanın resimleri” – Japonya’da tarihi sahneler, manzaralar, sumo güreşçileri vb. konulara odaklanan popüler bir sanat olarak gelişti. Bu tür, monokrom tahta baskılar etrafında dönüyordu, ancak sonunda tam renkli baskılara veya birden fazla tahta blokla “nishiki-e”ye geçiş yapıldı. Dijital fotoğrafçılığın yükselişi de dahil olmak üzere birçok faktör nedeniyle popülaritesi 19. yüzyılda azaldı.
Şimdi, iki görüntü oluşturma modelinin piyasaya sürülmesiyle Sakana, tarihi sanat eserlerini popüler kültüre geri getirmek istiyor. Bunlardan ilki – Evo-Ukiyoe – özellikle kiraz çiçekleri, kimono veya kuşlar gibi ukiyo-e sanatında yaygın olarak bulunan unsurları tanımlayan metin girişleriyle istendiğinde, ukiyo-e’ye çok benzeyen görüntüler üreten bir metinden görüntüye sunma olanağıdır. Hatta hamburger veya dizüstü bilgisayar gibi o zamanlar var olmayan şeylerle ukiyo-e tarzı sanat bile üretilebiliyor, ancak şirket bazen sonuçların ukiyo-e’ye hiç benzemeyerek yoldan sapabileceğini belirtiyor.
Model dayanmaktadır Evo-SDXL-JPSakana’nın geliştirdiği yeni evrimsel model birleştirme tekniği Stabilite Yapay Zekasının üstüne SDXL ve diğer açık difüzyon modelleri. Şirket, Ritsumeikan Üniversitesi Sanat Araştırma Merkezi (ARC) ile ortaklık yoluyla elde edilen 24.000’den fazla dikkatlice altyazılı ukiyo-e sanat eserinden oluşan bir veri kümesi üzerinde Evo-SDXL-JP’ye ince ayar yapmak için LoRA’yı (Düşük Sıralı Adaptasyon) kullandığını söyledi. Kyoto.
“Bu verileri, ARC koleksiyonundaki ukiyo-e’nin dijital görüntülerinden sanatın tamamını ve yüz merkezli olanları kapsayan geniş bir yelpazedeki konularla derledik. Çeşitliliği göz önünde bulundurarak güzel renklere sahip çok renkli nishiki-e’ye de odaklandık” diye yazdı şirket bir blog yazısında.
İkinci model Evo-Nishikie, monokrom Ukiyo-e baskılarını renklendiren, görüntüden görüntüye bir tekliftir. Sakana, tek renk mürekkeple basılan tarihi kitap illüstrasyonlarına renk eklenebileceğini veya mevcut çok renkli Nishikie baskılarına tamamen yeni görünümler kazandırabileceğini söylüyor. Kullanıcının yapması gereken tek şey, kaynak görüntüyü sağlamak ve belki de onu, renklendirilecek öğeleri açıklayan bir dizi talimatla eşleştirmek.
Sakana, Evo-Ukiyoe üzerinde ControlNet eğitimini sabit komutlar ve durum görüntüleri kullanarak gerçekleştirerek bu modeli hayata geçirdiğini söyledi.
Daha fazla araştırma ve geliştirme hedefi
Modeller yalnızca Japonca yönlendirmeyi desteklese ve çok erken aşamalarda olsa da Sakana, yapay zekaya geleneksel “Japon güzelliğini” öğretme çalışmasının ülke kültürünün çekiciliğini dünya çapında yayacağını ve eğitimde uygulamalar bulacağını ve klasik edebiyattan keyif almanın yeni yollarını bulacağını umuyor.
Şu anda şirket, başlamak için hem modelleri hem de ilgili kodu sağlıyor Sarılma yüz. Depoda bulunan Python betiği ve LoRA ağırlıkları şu adreste mevcuttur: Apaçi 2.0 lisans.
“Bu model yalnızca araştırma ve geliştirme amacıyla sağlanmıştır ve deneysel bir prototip olarak değerlendirilmelidir. Ticari kullanıma veya kritik görev ortamlarında kullanıma yönelik değildir. Bu modelin kullanımının riski kullanıcıya aittir ve performansı ve sonuçları garanti edilmez,” diye belirtiyor şirket Hugging Face’te.
Sakana AI’nın sahip olduğu kadarıyla 30 milyon dolar topladı birden fazla yatırımcıdan fon sağlanması, Lüks SermayeHugging Face gibi öncü yapay zeka şirketlerine yatırım yapan ve ayrıca Khosla Venturesyatırımlarıyla tanınan OpenAI 2019’a çok geri döndük.
Kaynak: https://venturebeat.com/ai/sakana-ai-drops-image-models-to-generate-japans-traditional-ukiyo-e-artwork/