麻省理工學院終於用送啤酒機器人作了有用的研究

2015.0812.1

我很懷疑,如果不是為了啤酒,機器人研究會落後現在幾年,甚至幾十年。這是因為啤酒是對於多數人會問研究人員,關於他們的機器人的問題的答案。也就是,「這很酷,但它有什麼作用?」,如果你回答:「它拿啤酒給我。」人們就會立刻了解你研究(並通常會聯想到機器人技術)的價值和重要性,不管它實際上是否如此。

話雖如此,讓機器人送啤酒其實涉及到很多複雜的問題,包括導航、感知、抓握和人機互動等問題。一旦你解決所有的問題,如果你打算同時送啤酒給你的朋友,你必須還得讓一群機器人協同工作。在麻省理工學院裡,他們已經開發出新型的多機器人任務規劃程序,讓分配啤酒即使在不確定因素下仍如期完成,這很明顯是這個世界所需要的。

麻省理工學院的研究人員正試圖解決,如何讓機器人在不知道另外一個機器人在做什麼的情況之下智慧化群組工作;換句話說,機器人所處的環境是溝通失效的狀態。

為了幫助機器人在不確定條件下合作(無論是否與溝通、感知或外聯有關),麻省理工學院研發出一種新型規劃算法,但名字可能是最糟的:MacDec-POMDP規劃程序。字的組成是:這是一個將大任務(Macro actions)分散(Decentralized )開來,使用部分可觀測(Partially Observed)馬爾可夫決策(Markov Decision)的過程(Processes)。

不管怎樣,MacDec-POMDP規劃程序能使個別的機器人從事高等推理,例如了解發生了甚麼事和它們應該要做什麼。就實際情況而言,這種推理能力讓機器人更可以執行例如「拿啤酒給我」的任務,即便它不知道其他機器人正在執行的任務和位置。

這項技術關鍵的區別在於採用被稱為「有限狀態控制器(finite state controller)」的技術而非「策略樹(policy tree)」:策略樹可以被認為是一系列「如果這事發生,那就做這其他事」的運算規則;而有限狀態控制器則是基於解決問題的高階模型,它著重結果而非執行細節。這使得機器人基於不同情況,更加容易制定規則。實際上,MacDec-POMDP規劃程序可以為一組機器人自動生成最大化實用和效率的控制器,即便每一個機器人有不同數量的不確定工作要處理。這不是容易去真正了解的概念,在論文中還有許多更詳細介紹。

這項研究不光用在分送啤酒,它還有其他的應用。例如,在倉庫或災難環境中,你或許有一堆機器人努力協調要完成交付的任務,但缺乏足夠資訊時,而這種規畫程序能讓它們的行動有一致性且有效率。