ICC訊 谷歌旗下 DeepMind 公司近日公布了三項(xiàng)新進(jìn)展,其中之一針對收集訓(xùn)練數(shù)據(jù)的系統(tǒng),起草了“機(jī)器人憲法”,確保 AI 機(jī)器人不會傷害人類。
谷歌的數(shù)據(jù)收集系統(tǒng) AutoRT 可以同時(shí)利用視覺語言模型(VLM)和大型語言模型(LLM),以理解其環(huán)境,適應(yīng)陌生環(huán)境,并決定適當(dāng)?shù)娜蝿?wù)。
本次起草的“機(jī)器人憲法”受艾薩克 阿西莫夫的“機(jī)器人三大定律”啟發(fā),圍繞著安全出發(fā),指示 LLM 避免選擇涉及人類、動物、尖銳物體甚至電器的任務(wù)。
DeepMind 表示為了提高安全性,編程限制了機(jī)器人的關(guān)節(jié),力超過一定閾值時(shí)自動停止,此外還配有專門的物理緊急停止開關(guān)。
谷歌表示在過去 7 個月的時(shí)間里,部署了一支由 53 臺 AutoRT 機(jī)器人組成的機(jī)群,分別部署在四個不同的辦公樓,并進(jìn)行了超過 77000 次試驗(yàn)。
一些機(jī)器人由人類操作員遠(yuǎn)程控制,而另一些則根據(jù)腳本或完全自主地使用谷歌的機(jī)器人變形器(RT-2)人工智能學(xué)習(xí)模型運(yùn)行。
試用中使用的機(jī)器人看起來更實(shí)用而不是花哨 —— 只配備了攝像頭、機(jī)械臂和移動底座。對于每個機(jī)器人,系統(tǒng)使用 VLM 來理解其環(huán)境和視野內(nèi)的物體。接下來,LLM 提出了機(jī)器人可以執(zhí)行的創(chuàng)造性任務(wù)清單,比如將零食放在臺面上,并扮演決策者的角色,選擇機(jī)器人執(zhí)行的適當(dāng)任務(wù)。
從報(bào)道中獲悉,DeepMind 的另一項(xiàng)新技術(shù)是 SARA-RT,這是一種神經(jīng)網(wǎng)絡(luò)架構(gòu),可以比現(xiàn)有的 Robotic Transformer RT-2 更準(zhǔn)確,速度也更快。
谷歌還宣布了 RT-Trajectory,添加了 2D 輪廓,以幫助機(jī)器人更好地執(zhí)行擦桌子等特定的物理任務(wù)。