地下隧道、城市地下、岩洞舉辦的「機器人死亡挑戰賽」，加速機器人進入消費電子的市場

談到移動機器人，你可能會在酒店、醫院、餐飲等服務領域經常會看到機器人的身影。除此之外，波士頓動力公司（Boston Dynamics）的網紅機器人，各種摸爬滾打的影片在網路上也吸引了許多目光。

但在一些更複雜、極端的環境下的機器人應用，仍然需要技術層面的深層突破。

這種局面無人駕駛車也曾遇到過。從 2004 到 2007 年，美國國防高等研究計劃署（DARPA，Defense Advanced Research Projects Agency）贊助了無人駕駛挑戰賽。大賽除了捧紅了光學雷達公司 Velodyne，同時也直接催生了此後十幾年火熱的自動駕駛賽道。

遵循同樣的想法，2018 年 DARPA 發起了機器人地下挑戰賽（Subterranean Challenge，SubT），並設置了 500 萬美元的獎金，吸引世界各地的機構和公司的工程師和科學家團隊來參加比賽。

▲ DARPA SubT 地下挑戰賽決賽結果｜IEEE

如今，此次持續近三年的系列賽已經落幕，最終 CERBERUS 團隊和 CSIRO Data61 團隊，分別獲得決賽的第一名和第二名。

除了比賽結果，這次挑戰賽更大的價值，在於對現實的映射。回顧這場比賽中遇到的問題和給出的解決方案，可以更深層地瞭解機器人發展的動向，以及加速機器人的普及。

機器人的「死亡挑戰賽」

談起舉辦這次地下挑戰賽的直接契機，DARPA 戰術技術辦公室專案經理 Timothy Chung 表示，這主要考慮到作戰人員的需求，以及先遣應急隊的需求。他們需要在各種地下環境中執行搜索和救援的任務，可能是人口密集的事故、自然災害，也可能是礦山等救援。

同時，在這次挑戰賽的官網，引用了克勞塞維茲在《戰爭論》中的一句話，「戰爭與地形的關係，要求我們具備快速而精準地獲取任何地區地形資訊的能力。」

▲ Cerberus 團隊的 ANYmal 機器人在自主探索洞穴｜IEEE

在比賽場地的選擇上，這次地下挑戰賽選取了地下隧道、城市地下、岩洞三個最具挑戰性的場景。在這樣的環境中，機器人將面臨很多極限的情況，比如地形非常複雜，無法使用 GPS，通訊受到限制，能見度低，移動性也受到挑戰等等。簡單說，DARPA 的目標是要尋找能在極端環境下，仍然能夠通行的機器人。

據主辦方介紹，他們希望參賽團隊在四個領域推動機器人技術的邊界：移動性（如何迅速移動）、感知（如何理解外界）、網路（把數據回傳伺服器）和自主權（機器自主決策）。

這場挑戰賽的規則是，參賽團隊要搜索、檢測比賽場地，找到並定位主辦方設置的 10 到 30 件物品的精確位置，這些物品可能包括人體模型、門、電動泵、閥門、背包、滅火器、收音機或手機，以及更多抽象的東西，如瓦斯洩漏。團隊的最終得分主要取決於他們能夠找到多少物品，以及花了多長的時間。

與此同時，參賽人員被禁止進入隧道，所有的工作必須要由參賽的機器人完成。標記精度在 5 公尺以內，被認為完成了定位，能獲得積分。

要想取得比賽的成功，還是非常有難度。因為涉及到隧道、城市、洞穴等場景，因此需要一個整體解決方案，來實現能力的相對平衡。舉個簡單例子，機器人需要足夠小巧才能通過狹窄通道，但它又需要攜帶足夠大的感測器和電腦，來為自己測繪、導航和作出自主決策；另外，在動力系統方面，機器人需要更加節能，才能在極端環境中行駛數公里，但自主決策和測繪都需要很大的電力需求。

對於這場比賽，官方的稱呼是「地下挑戰賽」，類似鐵人三項比賽，不是要找到最強的游泳、跑步和自行車運動員，而是要三項綜合成績最好的人。很多人覺得這種說法過於委婉，更應該把它稱為「機器人死亡挑戰賽」或「機器人奧運會」。

「機器人與地下城」

要真正理解這次挑戰賽，需要簡單回顧一下整個過程。據瞭解，2019 年 8 月，來自 8 個國家的 11 支機器人團隊，彙集在美國匹茲堡的一個礦洞，這是第一次隧道比賽（Tunnel Circuit）的場地。與團隊一起出現的，還有 20 架無人機、64 架地面機器人和一架名為 Duckiefloat 的自主飛艇。

▲ 參加 SubT 地下挑戰賽參賽團隊｜IEEE

大部分團隊的策略，是先派出機器人偵察、探測環境，然後根據場景和機器人性能，選擇合適的機器人完成定位任務。在比賽最開始時，情況還都很順利。但意外很快發生，通訊成了這次比賽的最大問題。就在機器人轉過礦洞第一個拐角的時候，許多團隊失去了與機器人的聯繫，因為無線電波無法穿透堅硬的岩石。

隨後，時間很快來到了 6 個月後，第二場比賽（Urban Circuit）來到了西雅圖附近的薩索普核電站。這個核電站始建於 1977 年，建設完成 80% 的時候，政府決定不再投入資金，這個核電站也成了廢棄項目。如今，它成為此次挑戰賽的場地。

如果說，在隧道挑戰賽中，通訊是一個巨大的挑戰。那在這次城市地下賽道中，通訊已經不是什麼大問題。參賽團隊進行了升級和反覆運算，使用可部署的網路節點建立了網狀網路。機器人在前進的過程中，每隔一段距離就會放置一個小的通訊機器人，然後它會自行建立起網路節點，這樣就可以在通訊範圍之外進行長時間的工作。

通訊問題解決了，但低溫成了問題。當時，廢棄核電站內的溫度是-4 °C，甚至比室外（2 °C）還要低。所以，參賽的團隊人員和機器人，都無法長期在比賽場地逗留太久，比賽結束立即轉移到溫暖的地方。

最終，CoSTAR 依靠更好的性能和表現，在城市地下巡迴賽中，總共獲得 16 分排名第一，比排名第二的 Explorer 高出 5 分，CTU-CRAS-NORLAB 團隊獲得第三名。

▲ DARPA SubT 地下挑戰賽決賽海報｜IEEE

第三場是洞穴巡迴賽，原本要在 2020 年秋季舉辦，但因為 COVID-19 被迫取消。所以，這場賽事直接跳到了 2021 年 9 月的決賽，地點是在路易斯維爾巨型洞穴，這是一個非常有挑戰性的場地。整個洞穴大約有 400 萬平方英尺（約 37 萬平方公尺），它的特點是結合了 DARPA 設計的三個場景，有不規則通道和大型洞穴系統，還具有複雜布局的地下結構。

這時，參賽隊伍已經從最初的 11 支，減少到 8 支。對所有的參賽隊伍來說，自主性是決賽的最大挑戰。因為比賽場地不允許團隊人員進入，每支團隊只有一個人可以對機器人進行遠端操控，所以讓機器人自行決定去哪裡，如何去哪裡，將是贏得比賽的關鍵。

在決賽結束時，CERBERUS 和 CSIRO Data61 兩支隊伍都發現了 23 件物品。因為使用時間更少，CERBERUS 團隊贏得最終的決賽冠軍，拿走了 200 萬美元獎金，CSIRO Data61 則獲得第二名。

啟示和未來

回顧機器人地下挑戰賽的三年間，應該是夢想照進現實的三年。CSIRO Data61 團隊負責人 Navinda Kottege 在接受採訪時曾表示，這次挑戰賽最有價值的地方在於，DARPA 剛開始知道機器人並沒有這種能力，但要求三年之後，形成一支有競爭力的機器人團隊。

最初的想法，也確實變為了現實。在挑戰賽開始之前，他們團隊確實有一些很炫酷的技術，但沒有機器人系統可以可靠地工作一個小時或者更長；但三年之後，他們可以部署機器人，讓他們自主地去做一些任務，然後團隊成員去做自己手中的工作，這是非常大的進步。

與此同時，這次挑戰賽也帶來了很多技術層面的驚喜，可能會引領機器人的發展。在這次系列賽中，參賽團隊帶來了很多形態的機器人，包括六足仿蜘蛛機器人，四輪車型機器人、履帶坦克型機器人、飛行機器人等。其中，輪式機器人提供了最可靠的機動性，無人機可以探索一些較大的洞穴。

但最令人印象深刻的是 CERBERUS 團隊的四足機器人 ANYmal C，在比賽中表現可靠，即便遭遇碰撞也可以保持穩定，完成了團隊的大部分工作。

▲ ANYmal C 四足機器人｜IEEE

這款機器人是由瑞士 ANYbotics 公司打造，有點像一隻大型犬，重量在50公斤左右，配備了攝影鏡頭、3D 感測器，包括用於 3D 繪圖和同步定位和映射（SLAM）的光學雷達，可以執行搜救、檢查等任務。移動速度上，它可以達到 1 公尺/秒，還能輕鬆處理 20 度的斜坡和 45 度的樓梯，以及跨越 25 公分的空隙，通過僅有 60 公分的通道。

更重要的是，ANYmal C 不需要進行艱苦的建模過程，以及危險且高成本的實地測試，就可以應對現實世界複雜的地形地貌。那它是怎麼達到的呢？

據團隊負責人介紹，在複雜的地形和無法準確探測環境的情況下，機器人必須依賴本體感受（proprioceptive）——在高時間解析度下感測其自身的身體形態。

為此，瑞士 ANYbotics 公司提出了一種穩健的控制器。這種控制器僅使用聯合編碼器和慣性測量單元的本體感受度量，這是腿式機器人上最耐用最可靠的感測器。有了新型控制器的加持，這些機器人可以輕鬆翻越溪流、草地、雪地、碎石坡等富有挑戰的場景。

同時，這個控制器由一種神經網路策略驅動，在類比環境中進行訓練。雖然沒有任何現實世界的資料和精確的地形模型，但控制器仍然能克服野外的各種不規則地形。研究人員還強調說，「我們的系統可以穿越幾乎所有地形，而且一次都沒有摔倒。」

除此之外，研發人員還引入了一些新的方法：首先，在模型上，ANYbotics 公司並沒有使用當前主流的的多層感知器（MLP），而是使用了序列模型，特別是感受狀態的時間卷積網路（TCN）；其次，是關於特許學習（privileged learning）。新模型在訓練中分為兩個階段，首先訓練教師策略，該策略可以存取特許資訊，即對地面的真實瞭解和機器人與之的接觸；隨後教師指導純本體感受的學生控制器學習，後者僅使用機器人本身可用的感測器資訊。

此外，這項研究中提到的方法並沒有用到攝影鏡頭、光學雷達或接觸式感測器資訊，只依賴本體感受感測器訊號（proprioceptive sensor signal）來提高控制策略在不同地形中的適應性和穩健性。

▲ CSIRO 團隊測繪的地圖精度極高｜IEEE

除了四足機器人，高精度的測繪地圖，也是這個挑戰賽讓人驚喜的地方。在此次挑戰賽中，CSIRO data61 團隊雖然排在第二位，但他們的機器人測繪得到的地圖，與 DARPA 的真實地圖相差不到 1%。

據瞭解，DARPA 官方的地圖，是邀請了專業的技術人員，使用了非常昂貴的設備，花費了 100 個小時進行專業測繪得來。但 CSIRO data61 團隊，只用了不到一個小時內，得到的結果就跟官方地圖接近。這背後的技術，著實讓所有人都很吃驚和好奇。

據瞭解，在 CSIRO data61 團隊背後，有一套叫 Wildcat 的自主機器人的研發平臺和工業應用的商業化解決方案。據團隊負責人曾介紹說，Wildcat 使用非線性優化演算法，將來自機器人感測器的 3D LiDAR（光檢測和測距）資料，即時轉換為高度詳細和準確的環境地圖，同時為機器人控制提供更新速率的姿態資訊。

機器人可以即時共用地圖片段，以幫助他們保持對環境變化的認識，並探索新的領域。這使他們能夠輕鬆地將不同的機器人平臺整合到他們的車隊中。

Wildcat 利用 CSIRO 十多年的 SLAM 研發經驗，該技術與 IMU（慣性運動單元）和 LiDAR 感測器結合使用，可選擇添加其他感測器，如化學、放射、氣體、GPS 和 Wi-Fi。

目前，Wildcat 解決方案已經開始商業化，無人機公司 Emesent 是其第一個客戶，同時它還其他幾家公司合作。

幾年前，波士頓動力在 YouTube 上傳的機器人影片，捧紅了旗下的雙足機器人和四足機器狗。但是，即便成為了「網紅」，波士頓動力輾轉於谷歌、軟銀和現代汽車的命運，也折射出機器人產業的舉步維艱。

最近兩年，小米等巨頭公司也開始紛紛押注機器人賽道，可以看出機器人已經成為一個新的風口。但不可否認的是，雖然機器人的價格已經不再「高不可及」，但是其使用場景依然局限於保全等固定場景。

DARPA 機器人挑戰賽雖然考驗的是機器人在極端環境中的搜尋和施救能力，但正像 15 年前的無人駕駛大賽催生了自動駕駛賽道，機器人大賽中所鍛煉出的地形掃描、製圖和運動能力，或將很快應用到市面可見的機器人產品中，極大拓展機器人的應用場景，並最終加快機器人向消費電子產品類別的過渡步伐。