Elma araştırmacılar “adlı yeni bir yapay zeka aracını tanıttılar”Anahtar kare“, doğal dil istemleri aracılığıyla statik görüntüleri canlandırmak için büyük dil modellerinin (LLM’ler) gücünden yararlanıyor.
Arxiv.org’da yayınlanan yeni bir araştırma makalesinde ayrıntıları verilen bu yeni uygulama, yapay zekanın yaratıcı sürece entegrasyonunda dev bir sıçramayı temsil ediyor ve aynı zamanda iPad gibi yeni nesil Apple ürünlerinde neler olacağına dair ipuçları da verebilir. Pro ve Vision Pro.
“ başlıklı araştırma makalesiKeyframer: Büyük Dil Modellerini Kullanarak Animasyon Tasarımını Güçlendirme“, yüksek lisansların animasyon endüstrisine uygulanmasında keşfedilmemiş alanları araştırıyor ve hareketin doğal dilde etkili bir şekilde nasıl tanımlanacağı gibi benzersiz zorlukları sunuyor.
Şunu hayal edin: Keşfetmek istediğiniz bir fikri olan bir animatörsünüz. Durağan görüntüleriniz ve anlatacak bir hikayeniz var, ancak eserlerinize hayat vermek için bir iPad’in üzerine eğilerek sayısız saat geçirme düşüncesi oldukça yorucu. Anahtar Kareleyici’ye girin. Sadece birkaç cümleyle bu görüntüler sanki aklınızı okumuş gibi ekranda dans etmeye başlayabilir. Daha doğrusu, sanki Apple’ın büyük dil modelleri (LLM’ler) varmış gibi.
‘Anahtar Kare’, kullanıcı geri bildirimi yoluyla animasyon sürecini nasıl geliştirir?
Keyframer geniş bir dil modeli tarafından desteklenmektedir (çalışmada, GPT-4) statik bir SVG görüntüsünden ve bilgi isteminden CSS animasyon kodu oluşturabilen. Araştırmacılar, “Geniş dil modelleri, çok çeşitli yaratıcı alanları etkileme potansiyeline sahiptir, ancak Yüksek Lisans’ın animasyona uygulanması yeterince araştırılmamıştır ve kullanıcıların hareketi doğal dilde etkili bir şekilde nasıl tanımlayabilecekleri gibi yeni zorluklar sunmaktadır” diye açıklıyor.
Bir animasyon oluşturmak için kullanıcının bir SVG görüntüsü yüklemesi, “Bulutların yavaşça sola doğru kaymasını sağlayın” gibi bir metin istemi yazması yeterlidir ve Keyframer, bu animasyonun gerçekleşmesi için kodu oluşturacaktır. Kullanıcılar daha sonra doğrudan CSS kodunu düzenleyerek veya doğal dilde yeni istemler ekleyerek animasyonu hassaslaştırabilir.
Makaleye göre, “Keyframer, oluşturulan çıktının yönlendirilmesi ve doğrudan düzenlenmesi yoluyla animasyonların araştırılmasını ve iyileştirilmesini destekliyor.” Bu kullanıcı merkezli yaklaşım, araştırma aracı hakkında geri bildirim sağlayan profesyonel animasyon tasarımcıları ve mühendisleriyle yapılan ve hepsi yinelemeli tasarım ve yaratıcılığa vurgu yapan çeşitli röportajlarla desteklendi.
Gazete için röportaj yapılan bir çalışma katılımcısı, “Sanırım bu, yaptığım pek çok şeyden çok daha hızlıydı… Sanırım daha önce böyle bir şey yapmak sadece saatler sürerdi” dedi.
Büyük dil modellerinin ufuklarını genişletmek
Araştırmacılar, çoğu kullanıcının tasarımları teşvik etmek için yinelemeli, “ayrıştırılmış” bir yaklaşım benimsediğini ve bireysel öğeleri tek tek canlandırmak için yeni istemler eklediğini buldu. Bu, yapay zekanın çıktılarına yanıt olarak hedeflerini kademeli olarak uyarlamalarına olanak sağladı.
Araştırmacılar makalede şöyle açıklıyor: “Keyframer, kullanıcıların tasarımlarının tamamını önceden düşünmek zorunda kalmak yerine, sıralı yönlendirme yoluyla tasarımlarını yinelemeli olarak hassaslaştırmalarına olanak tanıdı.” Doğrudan kod düzenleme özellikleri aynı zamanda ayrıntılı yaratıcı kontrolü de mümkün kıldı.
Yapay zeka animasyon araçları tasarımı demokratikleştirme potansiyeline sahip olsa da araştırmacılar, yaratıcı kontrolü ve memnuniyeti kaybetme konusundaki endişeleri kabul ediyor. Ancak Keyframer, yönlendirmeyi düzenlemeyle birleştirerek, kullanıcı aracılığını korurken erişilebilir prototip oluşturma sağlamayı amaçlamaktadır.
Araştırmacılar, “Bu çalışma aracılığıyla, yaratıcıların yaratıcı kontrolü sürdürmelerine olanak tanıyan dinamik editörlerle tasarım prototiplemeyi hızlandırmak için Yüksek Lisans’ların güçlü üretken yeteneklerini birleştiren gelecekteki animasyon tasarım araçlarına ilham vermeyi umuyoruz” dedi.
‘Anahtar Kare’nin yaratıcı endüstrilerdeki daha geniş etkisi
Keyframer, animasyon ortamını dönüştürerek geniş bir yaratıcı yelpazesi için daha erişilebilir hale getirmeyi vaat ediyor. Oyun alanının önemli ölçüde eşitlenmesi olarak görülen Keyframer, uzman olmayanlara hikayeleri animasyon yoluyla hayata geçirme kapasitesi sunuyor; bu, bir zamanlar önemli ölçüde teknik beceri ve kaynak gerektiren bir görevdi. Bu, yapay zekanın yaratıcı süreçte işbirliğine dayalı bir güç olarak büyüyen rolünün bir kanıtıdır ve teknolojinin çeşitli sektörlerde nasıl kullanıldığına dair bir değişime işaret etmektedir.
Keyframer’ın etkileri, yapay zekanın insanın yaratıcı deneyiminin daha sezgisel ve ayrılmaz bir parçası haline geldiği beklenen bir kültürel değişime kadar uzanıyor. Bu yalnızca teknolojik bir sıçrama değil, aynı zamanda dijital alanla etkileşimimizin yapısını yeniden tasarlamak için potansiyel bir katalizördür. Apple’ın Keyframer ile yaptığı hamle, yaratıcı ile yaratıcı arasındaki sınırların, yapay zekanın görünmez eli tarafından yönlendirilerek giderek daha akışkan hale geldiği yeni bir çağın habercisi olabilir.
VentureBeat’in misyonu teknik karar vericilerin dönüştürücü kurumsal teknoloji hakkında bilgi edinmeleri ve işlem yapmaları için dijital bir şehir meydanı olmaktır. Brifinglerimizi keşfedin.
Kaynak: https://venturebeat.com/ai/apple-researchers-unveil-keyframer-an-ai-tool-that-animates-still-images-using-llms/