Atlas機器人跑酷關鍵技術揭密

作者 : Pat Marion,BostonDynamics

感知和適應性使Atlas能夠執行各種高能量的行為,例如跑酷。

波士頓動力(Boston Dynamics)旗下雙足機器人Altas每次新的視訊發佈,都會刷新大眾對機器人的認知。日前,Altas跑酷(parkour)再次引起了關注及熱議。Altas在視訊中完成了過獨木橋、跳箱子、走斜板、支撐跨欄、後空翻下台階等動作。

這些驚險動作是如何實現的?需要哪些技術支援?近日,Boston Dynamics在其技術部落格中解密在Atlas奔跑、翻轉、跳躍背後複雜而精妙的感知與控制機理。

建立基礎

Boston Dynamics的Altas團隊負責人Scott Kuindersma表示:「從技術角度來看,類人機器人提出了一些研究挑戰,其尺寸和複雜度的結合創造了與強度重量比、運行時間、運動範圍和實理強韌性相關的硬體設計權衡。與此同時,Boston Dynamics的控制團隊必須創建演算法來推論這些機器的複雜性,以創建廣泛的高能量和協調行為。最終,推動像Atlas這樣的類人機器人的極限推動硬體和軟體創新,這轉化為Boston Dynamics的所有機器人基礎。」

跑酷雖然看似狹窄而具體,但它為Atlas團隊提供了一個完美的沙箱來試驗新的行為。這是一項全身活動,需要Atlas在不同情況下保持平衡,並在一種行為和另一種行為之間無縫切換。

Kuindersma說:「這實際上是在機器人能力的極限下創造行為,並讓它們在一個靈活的控制系統中協同工作。跑酷不會強迫你解決許多重要的問題,但這不是重點。Boston Dynamics不會試圖一下子解決所有問題。Boston Dynamics現在所做的工作使Boston Dynamics能夠為解決下一組研究問題奠定堅實的基礎。」

創建這些高能量展示是一個有趣的挑戰,但Boston Dynamics的技術目標不僅僅是創建一個華麗的性能。Atlas計劃使用跑酷作為實驗主題,研究完善Atlas在快速動作、動態姿態以及感知-控制連接之間的快速調整能力。

跑酷的感知

機器人感知演算法用於將來自相機和光達(LiDAR)等感測器的資料轉換為對決策和規劃實理動作有用的資料。雖然Atlas使用IMU、關節位置和力感測器來控制其身體動作並感覺地面以保持平衡,但它需要感知來辨識和導航障礙物,如圖1中的間隙和窄樑。

圖 1:此動畫顯示Atlas機器人的深度相機產生點雲旋轉視圖,而另一個機器人則跳過了它的視野。

Atlas使用飛行時間(ToF)深度相機以每秒15格的速度產生環境的點雲。點雲是範圍測量的大量集合。Atlas的感知軟體使用一種稱為多平面分割的演算法,從這個點雲中提取表面。該演算法的輸出被饋入至映射系統中,以建構Atlas用其相機看到的不同對象模型。A rendering of Atlas with perception outputs

圖2:具有感知輸出的Atlas渲染。

圖2顯示Atlas所見以及如何使用這種感知來規劃行動。左上角是深度相機拍攝的紅外線影像。主要影像中的白點形成點雲。橙色輪廓標記了偵測到跑酷障礙物的矩形面,隨著時間的推移從感測器觀察中對其進行追蹤。然後將這些偵測到的人臉用於規劃特定行為。例如,綠色的腳步代表下一步要跳到哪裡慢跑的未來計劃。

為了執行擴展跑酷課程,Boston Dynamics為機器人提供了一張地圖,其中包括Boston Dynamics希望它去的地方以及沿途應該做的特技。這張地圖並不是實際路線的精確幾何匹配,而是一個包含障礙樣板和註釋動作的近似描述。Atlas使用這些稀疏資訊來導航課程,但使用即時感知數據來填充細節。例如,Atlas知道尋找要跳的盒子,如果盒子向側面移動0.5公尺,Atlas會在那裡找到它並跳到那裡。如果盒子被移得太遠,那麼系統將會找不到並停下來。

圖 3:動畫顯示機器人感知到跑酷路線中的伙伴。

該3D動畫顯示了機器人在跑酷障礙路線中導航時所看到的和計劃的。主動追蹤的對象以綠色繪製,並在脫離機器人感知感測器的視野時,從綠色淡化為紫色。追蹤系統不斷估計世界上物體的姿態,導航系統使用地圖資訊規劃與這些物體相關的綠色足跡。

行為資料庫

在跑酷程序中看到Atlas執行的每個動作,都源自於使用軌跡最佳化提前創建的樣板。創建這些樣板的工具庫允許Boston Dynamics添加新軌跡來不斷為機器人添加新功能。給定感知的計劃目標,機器人從庫中選擇與給定目標盡可能匹配的行為。

透過軌跡最佳化離線設計行為,讓Boston Dynamics的工程師能夠提前以互動方式探索機器人能力的極限,並減少必須對機器人進行的計算量。例如,由於驅動限制等實體限制,機器人如何精確協調其四肢以啟動和收起後空翻的細節,可能對成功產生重大影響。利用離線最佳化,Boston Dynamics可在設計時擷取像這樣的重要限制,並使用單個通用控制器線上調整。

圖4:此拱頂行為是使用離線軌跡最佳化設計的全身行為的示例。Boston Dynamics的線上控制器將樣板動作變為現實。

模型預測控制

確定了機器人前面的箱子、坡道或障礙物並計劃一連串操作以利於跳越後,剩下的挑戰是填寫機器人可靠執行計劃所需的所有細節。

Atlas的控制器是所謂的模型預測控制器(MPC),因為它使用機器人動力學模型來預測其運動將如何演變為未來。控制器透過求解最佳化來運算現在要做的最佳事情,以便隨著時間的推移產生最佳可能的運動。

正如Boston Dynamics所描述的,在其行為庫中的每個樣板都為控制器提供了關於好的解決方案是什麼樣子的資訊。控制器會調整力、姿勢和行為時間等細節,以因應環境幾何、腳滑或其他即時因素的差異。擁有能夠顯著偏離樣板運動的控制器簡化了行為創建過程,因為這意味著Boston Dynamics不必擁有與機器人將遇到的每種可能場景相匹配的行為模板。例如,從52公分的平台上跳下與從40公分的平台上跳下沒有什麼不同,Boston Dynamics認為MPC能夠掌握細節。

圖 5:顯示感知和計劃路徑的第一人稱視角。藍色箭頭對應於機器人在整個過程中移動時的質量和動量中心的MPC預測。

MPC的預測特性還允許Atlas跨行為邊界查看。例如,知道跳躍之後是後空翻,控制器可以自動創建從一個動作到另一個動作的平滑過渡。這再次簡化了行為創建問題,因為Boston Dynamics不需要提前考慮所有可能的行為序列。當然,對 於MPC創新的期望是有限的。例如,嘗試從快進慢跑運動過渡到後空翻是行不通的。一般來說,必須在控制器複雜性和行為庫大小之間取得平衡。

本文原刊登於EDN China網站,夏菲編譯

加入LINE@,最新消息一手掌握!

發表評論