Google, bir robotun yardımıyla Gemini AI modelinin neler yapabileceğini göstermenin yeni bir yolunu buldu.
Bu, Google’ın geçen yıl kapatılan Herkes Robotları Bölümü’nden bir robottu. Ancak görünüşe göre robotlar hala ortalıkta, bu yüzden Google bunlardan birine sarı bir papyon taktı ve ardından robota komutlara nasıl yanıt vereceğini ve DeepMind ofis alanında nasıl gezineceğini öğretmek için Gemini’yi kullandı.
Bunu başarmak için Google, metinlerin yanı sıra resimler ve videolar üzerinde de eğitilen, soruları yanıtlamalarına ve algı gerektiren görevleri gerçekleştirmelerine olanak tanıyan görme dili modelleri VLM’leri kullanıyor.
Örneğin bir videoda bir Google çalışanı robottan kendisini bir şeyler çizmesi için bir yere götürmesini istiyor. Robot, düşünmek için bir dakikaya ihtiyacı olduğunu söylüyor ve ardından çalışanı beyaz tahtaya götürüyor. Başka bir videoda robota, Mavi Alan olarak adlandırılan yere ulaşmak için bir haritanın gösterildiği beyaz tahtadaki talimatları takip etmesi söyleniyor. Robot, robotik test alanına giden talimatları takip ediyor ve ardından “Beyaz tahtadaki talimatları başarıyla takip ettim” diye duyuruyor.
Robotu çalışırken görmek için oynat tuşuna basın, ardından yorumlarınızda ne düşündüğünüzü bize bildirin!
Kaynak: https://techcrunch.com/video/techcrunch-minute-a-google-robot-shows-off-what-gemini-can-do/