Araştırmacılar, LucidSim adı verilen sistemi, bir robot köpeği parkurda eğitmek, hiçbir gerçek dünya verisi görmemesine rağmen onun bir kutunun üzerinden geçmesini ve merdivenleri tırmanmasını sağlamak için kullandılar. Bu yaklaşım, robotlara zorlu görevleri yapmayı öğretme konusunda üretken yapay zekanın ne kadar yararlı olabileceğini gösteriyor. Bu aynı zamanda onları tamamen sanal dünyalarda eğitme ihtimalimizi de artırıyor. araştırma Geçen hafta Robot Öğrenme Konferansında (CoRL) sunuldu.
Projede çalışan MIT CSAIL’den doktora sonrası araştırmacı Ge Yang, “Robot teknolojisinde endüstriyel devrimin ortasındayız” diyor. “Bu, bunların etkisini anlama girişimimizdir. [generative AI] bizi yeni nesil araç ve modellere yönlendireceği umuduyla, orijinal amaçlarının dışında modeller.”
LucidSim, görsel eğitim verilerini oluşturmak için üretken yapay zeka modellerinin bir kombinasyonunu kullanıyor. İlk olarak araştırmacılar, ChatGPT için binlerce istem oluşturdu ve farklı hava koşulları, günün saatleri ve aydınlatma koşulları da dahil olmak üzere robotun gerçek dünyada karşılaşacağı koşulları temsil eden bir dizi ortamın açıklamalarını oluşturmasını sağladı. Örneğin, bunlar arasında ‘her biri geleneksel süslemeler ve kaligrafi sergileyen, çay evleri ve küçük, ilginç dükkanlarla kaplı eski bir sokak’ ve ‘güneş, kuru yamalarla noktalı, biraz dağınık bir çimenliği aydınlatıyor.’ yer alıyordu.
Bu açıklamalar, 3 boyutlu geometri ve fizik verilerini yapay zeka tarafından oluşturulan görüntülere eşleyen ve robotun takip edeceği yörüngeyi haritalayan kısa videolar oluşturan bir sisteme beslendi. Robot, gezinmesi gereken şeylerin (örneğin bir kutu veya bir dizi merdiven) yüksekliğini, genişliğini ve derinliğini hesaplamak için bu bilgiden yararlanır.
Araştırmacılar LucidSim’i, bir web kamerasıyla donatılmış dört ayaklı bir robota, bir trafik konisinin veya futbol topunun yerini bulma, bir kutunun üzerinden tırmanma ve merdivenlerden yukarı ve aşağı yürüme dahil olmak üzere çeşitli görevleri tamamlaması talimatını vererek test etti. Robot, geleneksel simülasyonlarla eğitilmiş bir sistemi çalıştırdığı zamana göre sürekli olarak daha iyi performans gösterdi. Koninin yerini belirlemek için yapılan 20 denemeden LucidSim’in başarı oranı %100 iken, standart simülasyonlar üzerine eğitilmiş sistemlerde bu oran %70’ti. Benzer şekilde, LucidSim diğer 20 denemede futbol topuna %85 oranında ulaşırken, diğer sistem için bu oran yalnızca %35’ti.
Son olarak robot, LucidSim’i çalıştırırken, diğer sistem için sadece %50’ye kıyasla, 10 merdiven çıkma denemesinin tamamını başarıyla tamamladı.
Araştırmada çalışan MIT’den doçent Phillip Isola, LucidSim’in dil, görüntü ve fizik modellerinin bir araya getirilmesinden ziyade doğrudan karmaşık üretken video modellerinden yararlanması durumunda bu sonuçların gelecekte daha da iyileşmesinin muhtemel olduğunu söylüyor.
New York Üniversitesi’nde doktora öğrencisi olan Mahi Shafiullah, araştırmacıların üretken yapay zeka kullanımına yönelik yaklaşımının, daha ilginç yeni araştırmaların önünü açacak yeni bir yaklaşım olduğunu söylüyor. Robotları eğitmek için yapay zeka modellerive proje üzerinde çalışmadı.
Kaynak: https://www.technologyreview.com/2024/11/12/1106811/generative-ai-taught-a-robot-dog-to-scramble-around-a-new-environment/