MIT bu hafta robotların eğitimi için yeni bir model sergiledi. Robotlara yeni görevleri öğretmek için kullanılan standart odaklanmış veri seti yerine, yöntem büyüyor ve büyük dil modellerini (LLM’ler) eğitmek için kullanılan devasa bilgi hazinelerini taklit ediyor.
Araştırmacılar, temsilcinin bir görevi yerine getiren bir kişiyi takip ederek öğrendiği taklit öğrenmenin, küçük zorluklarla karşılaşıldığında başarısız olabileceğini belirtiyor. Bunlar aydınlatma, farklı bir ortam veya yeni engeller gibi şeyler olabilir. Bu senaryolarda robotların uyum sağlamak için yararlanabilecekleri yeterli veri bulunmuyor.
Ekip, problem çözmeye yönelik bir tür kaba kuvvet verisi yaklaşımı için GPT-4 gibi modellere baktı.
Yeni makalenin başyazarı Lirui Wang, “Dil alanında verilerin tamamı cümlelerden ibaret” diyor. “Robotikte, verilerdeki tüm heterojenlik göz önüne alındığında, benzer şekilde ön eğitim yapmak istiyorsanız farklı bir mimariye ihtiyacımız var.”
Ekip, farklı sensörlerden ve farklı ortamlardan gelen bilgileri bir araya getiren Heterojen Önceden Eğitimli Transformatörler (HPT) adı verilen yeni bir mimariyi tanıttı. Daha sonra verileri eğitim modellerinde bir araya getirmek için bir transformatör kullanıldı. Transformatör ne kadar büyük olursa, çıkış o kadar iyi olur.
Kullanıcılar daha sonra robot tasarımını, konfigürasyonunu ve yapılmasını istedikleri işi girerler.
CMU doçenti David Held, araştırma hakkında şunları söyledi: “Hayalimiz, herhangi bir eğitim almadan robotunuz için indirebileceğiniz ve kullanabileceğiniz evrensel bir robot beynine sahip olmak.” “Henüz erken aşamalarda olsak da, sıkı bir şekilde zorlamaya devam edeceğiz ve ölçeklendirmenin, büyük dil modellerinde olduğu gibi, robotik politikalarda da bir ilerlemeye yol açmasını umuyoruz.”
Araştırma kısmen Toyota Araştırma Enstitüsü tarafından kuruldu. Geçen yıl TechCrunch Disrupt’ta TRI, robotları bir gecede eğitmeye yönelik bir yöntemi tanıttı. Yakın zamanda robot öğrenme araştırmalarını Boston Dynamics donanımıyla birleştirecek bir dönüm noktası ortaklığına imza attı.
Kaynak: https://techcrunch.com/2024/11/02/mit-debuts-a-large-language-model-inspired-method-for-teaching-robots-new-skills/