DeepMind機器人團隊近日公布了三項新進展,旨在幫助機器人在實驗室外做出更快、更好、更安全的決策。其中之一是通過“機器人守則”系統(tǒng)來收集訓練數(shù)據(jù),以確保機器人辦公室助理在為人們?nèi)?a href="http://www.22a6.cn/app/25363.html" target="_blank">打印紙時不會攻擊擋道的同事。
谷歌的數(shù)據(jù)收集系統(tǒng)AutoRT采用視覺語言模型(VLM)和大型語言模型(LLM)的協(xié)同工作,以了解環(huán)境、適應陌生情境,并決定適當?shù)娜蝿?。這個“機器人守則”靈感來自于阿西莫夫的《機器人三定律》,被描述為一套“以安全為中心的提示”,指導機器人的AI在選擇任務時避免涉及人類、動物、尖銳物體甚至電器。
為了提高安全性,DeepMind對機器人進行了編程,當機器人關(guān)節(jié)上的力超過一定閾值時,會自動停止。機器人還配備了一個實體的終止開關(guān),人類操作員可以使用它來立即關(guān)閉機器人。在過去的七個月里,谷歌在四棟不同的辦公樓中部署了由53臺AutoRT機器人組成的車隊,并進行了77000多次試驗。其中一些機器人由人類操作員遠程控制,而另一些機器人則完全自主地根據(jù)腳本或使用谷歌的機器人變壓器(RT-2)AI學習模型進行操作。
這些實驗中使用的機器人主要以實用性為導向,只配備了攝像頭、機械臂和移動底座。每個機器人都使用VLM(AI視覺語言模組)來了解環(huán)境和視線內(nèi)的物體。接下來,LLM(AI大型語言模組)會提供一系列創(chuàng)造性任務的建議,例如“將零食放在臺面上”,并扮演決策者的角色,為機器人選擇合適的任務執(zhí)行。