DeepMind機(jī)器人團(tuán)隊(duì)近日公布了三項(xiàng)新進(jìn)展,旨在幫助機(jī)器人在實(shí)驗(yàn)室外做出更快、更好、更安全的決策。其中之一是通過(guò)“機(jī)器人守則”系統(tǒng)來(lái)收集訓(xùn)練數(shù)據(jù),以確保機(jī)器人辦公室助理在為人們?nèi)?a href="http://www.22a6.cn/app/25363.html" target="_blank">打印紙時(shí)不會(huì)攻擊擋道的同事。

谷歌的數(shù)據(jù)收集系統(tǒng)AutoRT采用視覺(jué)語(yǔ)言模型(VLM)和大型語(yǔ)言模型(LLM)的協(xié)同工作,以了解環(huán)境、適應(yīng)陌生情境,并決定適當(dāng)?shù)娜蝿?wù)。這個(gè)“機(jī)器人守則”靈感來(lái)自于阿西莫夫的《機(jī)器人三定律》,被描述為一套“以安全為中心的提示”,指導(dǎo)機(jī)器人的AI在選擇任務(wù)時(shí)避免涉及人類、動(dòng)物、尖銳物體甚至電器。
為了提高安全性,DeepMind對(duì)機(jī)器人進(jìn)行了編程,當(dāng)機(jī)器人關(guān)節(jié)上的力超過(guò)一定閾值時(shí),會(huì)自動(dòng)停止。機(jī)器人還配備了一個(gè)實(shí)體的終止開關(guān),人類操作員可以使用它來(lái)立即關(guān)閉機(jī)器人。在過(guò)去的七個(gè)月里,谷歌在四棟不同的辦公樓中部署了由53臺(tái)AutoRT機(jī)器人組成的車隊(duì),并進(jìn)行了77000多次試驗(yàn)。其中一些機(jī)器人由人類操作員遠(yuǎn)程控制,而另一些機(jī)器人則完全自主地根據(jù)腳本或使用谷歌的機(jī)器人變壓器(RT-2)AI學(xué)習(xí)模型進(jìn)行操作。

這些實(shí)驗(yàn)中使用的機(jī)器人主要以實(shí)用性為導(dǎo)向,只配備了攝像頭、機(jī)械臂和移動(dòng)底座。每個(gè)機(jī)器人都使用VLM(AI視覺(jué)語(yǔ)言模組)來(lái)了解環(huán)境和視線內(nèi)的物體。接下來(lái),LLM(AI大型語(yǔ)言模組)會(huì)提供一系列創(chuàng)造性任務(wù)的建議,例如“將零食放在臺(tái)面上”,并扮演決策者的角色,為機(jī)器人選擇合適的任務(wù)執(zhí)行。





























浙公網(wǎng)安備 33010502007447號(hào)