Covariant robotlar için ChatGPT geliştiriyor

Bu hafta kovaryant RFM-1’in (Robotics Foundation Model 1) lansmanını duyurdu. UC Berkeley yapay zeka şirketinin kurucu ortağı ve CEO’su Peter Chen, TechCrunch’a platformun “temelde büyük bir dil modeli (LLM) olduğunu, ancak robot dili için olduğunu” söylüyor.

RFM-1, diğer şeylerin yanı sıra, Covariant’ın Brain AI platformunun konuşlandırılmasından toplanan devasa miktarda verinin sonucudur. Müşteri onayıyla girişim, bir LLM veritabanının robot eşdeğerini oluşturuyor.

Chen, “RFM-1’in vizyonu gelecek milyarlarca robota güç vermektir” diyor. “Covariant olarak biz zaten depolarda çok sayıda robotu başarıyla kullandık. Ancak ulaşmak istediğimiz noktanın sınırı bu değil. Üretimde, gıda işlemede, geri dönüşümde, tarımda, hizmet sektöründe ve hatta insanların evlerinde robotlara güç vermeyi gerçekten istiyoruz.”

Platform, giderek daha fazla robotik firmasının “genel amaçlı” sistemlerin geleceğini tartıştığı bir dönemde açılıyor. Agility, Figure, 1X ve Apptronik gibi insansı robotik firmalarının ani saldırısı bu konuşmada çok önemli bir rol oynadı. Form faktörü özellikle uyarlanabilirliğe uygundur (modellendiği insanlar gibi), ancak yerleşik yapay zeka/yazılım sistemlerinin sağlamlığı tamamen başka bir sorudur.

Şimdilik Covariant’ın yazılımı büyük ölçüde, çöp toplama gibi işler de dahil olmak üzere çeşitli tanıdık depo görevlerini yerine getiren endüstriyel robotik kollar üzerinde kullanılıyor. Şirket şu anda insansılar üzerinde konuşlandırılmıyor, ancak şirket bir düzeyde donanım agnostisizmi vaat ediyor.

Chen, “Daha genel amaçlı robot donanım alanında yapılan işlerin çoğunu seviyoruz” diyor. “Zeka dönüm noktasını donanım dönüm noktasıyla birleştirmek, robot uygulamalarında daha da fazla patlama göreceğimiz yerdir. Ancak bunların çoğu, özellikle donanım tarafında, henüz tam olarak orada değil. Sahne videosunun ötesine geçmek çok zor. Kaç kişi bir insansı ile şahsen etkileşime girdi? Bu size olgunluğun derecesini anlatır.”

Ancak Covariant, RFM-1’in robotların karar verme süreçlerinde oynadığı rol söz konusu olduğunda insan karşılaştırmalarından çekinmiyor. Basın materyaline göre platform, “robotlara insan benzeri akıl yürütme yeteneği sağlıyor; bu, Üretken Yapay Zekanın ticari robotlara dil ve fiziksel dünya hakkında daha derin bir anlayış kazandırdığını ilk kez temsil ediyor.”

Bu, hem soyut, hatta felsefi kavramlarla karşılaştırmalar hem de bunların gerçek dünyadaki zaman içindeki etkileri açısından iddialara karşı dikkatli olmamız gereken alanlardan biridir. “İnsan benzeri akıl yürütme yeteneği”, birçok farklı insan için pek çok farklı şey ifade eden geniş kapsamlı bir kavramdır. Burada kavram, sistemin gerçek dünya verilerini işleme ve eldeki görevi gerçekleştirmek için en iyi eylem planını belirleme becerisine uygulanır.

Bu, tek bir işe tekrar tekrar ve sonsuza kadar programlanan geleneksel robotik sistemlerden bir sapmadır. Bu tür tek amaçlı robotlar, otomotiv montaj hatlarından başlayarak yüksek düzeyde yapılandırılmış ortamlarda başarılı oldu. Eldeki görevde çok az değişiklik olduğu sürece, bir robot kol işini tekrar tekrar, engellenmeden yapabilir, ta ki bir gün sonra, yıllar süren sadık hizmetinin karşılığında altın cep saatini alma zamanı gelene kadar.

Ancak en küçük sapmalarda bile işler hızla bozulabilir. Nesnenin taşıma bandına tam olarak yerleştirilmediğini veya araç içi kameraları etkileyen aydınlatmada bir ayarlama yapıldığını varsayalım. Bu tür farklılıkların robotun çalışma yeteneği üzerinde büyük etkisi olabilir. Şimdi bu robotun yeni bir parçayla, yeni bir malzemeyle çalışmasını ve hatta tamamen farklı bir görevi yerine getirmesini sağlamaya çalıştığınızı hayal edin. Bu daha da zor.

Programcıların geleneksel olarak devreye girdiği nokta burasıdır. Robotun yeniden programlanması gerekir. Çoğu zaman fabrikanın dışından birisi sahneye çıkıyor. Bu büyük bir kaynak ve zaman kaybıdır. Bundan kaçınmak istiyorsanız iki şeyden birinin gerçekleşmesi gerekir. 1. Sahada çalışan kişilerin kod öğrenmesi gerekiyor veya 2. Robotla etkileşim kurmak için yeni, daha doğal bir yönteme ihtiyacınız var.

İlkini yapmak harika olsa da şirketlerin parayı yatırmaya ve gerekli zamanı beklemeye istekli olmaları pek mümkün görünmüyor. İkincisi, tam olarak Covariant’ın RFM-1 ile yapmaya çalıştığı şeydir. “Robotlar için ChatGPT” mükemmel bir benzetme olmasa da makul bir kısaltmadır (özellikle kurucuların OpenAI ile olan bağlantısı ışığında).

Müşterinin bakış açısından platform, tüketiciye yönelik üretken yapay zekanın mevcut versiyonuna çok benzeyen bir metin alanı olarak sunuluyor. Yazarak veya sesle “elmayı al” gibi bir metin komutu girdiğinizde sistem, önündeki tanıma en yakın nesneyi tanımlamak için eğitim verilerini (şekil, renk, boyut vb.) kullanır.

RFM-1 daha sonra geçmiş eğitimleri kullanarak en iyi eylem planını belirlemek için video sonuçları (özünde simülasyonlar) oluşturur. Bu son kısım, beynimizin bir eylemin potansiyel sonuçlarını gerçekleştirmeden önce nasıl hesapladığına benzer.

Canlı bir demo sırasında sistem, “kırmızı nesneyi al” ve hatta anlamsal olarak daha karmaşık olan “ayakkabılarını giymeden önce ayağına koyduğunu al” gibi girdilere tepki verir ve bu da robotun nesneyi doğru bir şekilde almasına neden olur. sırasıyla elma ve bir çift çorap.

Sistemin vaatleri tartışılırken pek çok büyük fikir ortaya atılıyor. En azından Covariant’ın kurucuları arasında etkileyici bir soyağacı var. Chen, Berkeley’de Kovaryant kurucu ortağı ve Baş Bilim Adamı Pieter Abbeel’in yanında yapay zeka eğitimi aldı. Abbeel ayrıca Chen’in ChatGPT firmasına katılmasından bir ay sonra 2016’da ilk OpenAI çalışanı oldu. Covariant ertesi yıl kuruldu.

Chen, şirketin yeni RFM-1 platformunun Covariant yazılımının halihazırda kurulu olduğu donanımların “çoğunluğuyla” çalışmasını beklediğini söyledi.

Kaynak: https://techcrunch.com/2024/03/11/covariant-is-building-chatgpt-for-robots/