對救援人員和戶外運動愛好者來說,穿越荒野小徑是一項有用的技能,但對機器人來說卻很難。這并不是說這些機械野獸在爬上山坡的同時沒有能力避開倒下的樹枝,最先進的機器學習算法可以做到這一點。問題在于它們?nèi)狈νㄓ眯?人工智能驅(qū)動的機器人經(jīng)常在它們從未見過的環(huán)境中掙扎。
科羅拉多大學的研究人員最近在預印本服務器Arxiv.org上發(fā)表了一篇論文(“荒野小徑上機器人從虛擬到現(xiàn)實轉(zhuǎn)移學習”)。提出了一個解決方案。他們的方法利用各種深度學習模型 - 即神經(jīng)元模擬數(shù)學函數(shù)層 - 來幫助機器人從相機鏡頭中判斷遠足路線的方向。
“機器人在許多涉及戶外使用的場景中都有前途,例如搜索和救援,野生動植物管理以及收集數(shù)據(jù)以改善環(huán)境、氣候和天氣預報。”研究人員寫道,“然而,戶外步道的自主導航仍然是一個具有挑戰(zhàn)性的問題......在許多情況下,收集和訓練訓練數(shù)據(jù)集可能不太可行或不實用,特別是由于季節(jié)性天氣變化、風暴和自然侵蝕,路徑條件可能會發(fā)生變化。”
正如該論文的作者指出的那樣,戶外路徑存在很多變化。它們由任何數(shù)量的材料(如礫石,泥土和覆蓋物)定義,并且它們跨越不同的生物群落,例如森林、草地和山脈。此外,它們的外觀隨著季節(jié)、天氣和一天中的時間而變化,并且它們通常被茂密的植被部分遮擋。
收集和標記訓練強大系統(tǒng)所需的真實數(shù)據(jù)將非常耗時,因此研究人員采購了虛擬戶外路徑的合成圖像。為了制作它們,他們組裝了一個阿爾卑斯山的場景,在Unity中有泥土小徑,點綴著Unity Asset Store的樹木、巖石和草的3D模型。然后,他們放置了一個帶有三個攝像頭的虛擬機器人,每個攝像頭分別具有400×400像素的分辨率和80度的視野,可以收集20,269張景觀圖像。
該團隊將圖像調(diào)整為100×100×3像素的分辨率,KUKA機器人維修,以實現(xiàn)更快的處理速度和更低的內(nèi)存消耗。然后他們將集合分成三個獨立的集合:一個用于訓練,一個用于驗證,第三個用于測試。
訓練數(shù)據(jù)集被饋送到具有不同架構(gòu)的三個不同神經(jīng)網(wǎng)絡:深度神經(jīng)網(wǎng)絡(DNN),卷積神經(jīng)網(wǎng)絡(CNN)和遞歸神經(jīng)網(wǎng)絡(RNN)。在AI完全控制虛擬機器人的實驗中,一個模型 - RNN - 設(shè)法以95.02%的準確度預測正確的軌跡方向。重要的是,在一個單獨的測試中,研究人員在4,000個真實世界圖像的數(shù)據(jù)集上訓練了所有三種AI算法,DNN模型的準確度達到了58.41%,超過了基線,并表明虛擬到現(xiàn)實的轉(zhuǎn)移學習有潛力超越一些傳統(tǒng)的計算機視覺方法。
“觀察到機器人在導航路徑方面取得了很大的成功,包括那些急轉(zhuǎn)彎,巨石等障礙物。”研究人員寫道,庫卡機器人何服電機維修,“此外,我們觀察了幾個'智能'決策的實例;在一次試驗中,機器人在與一個大障礙物碰撞后短暫地偏離了小徑,然后導航回到小徑并恢復其行程。”
這三個神經(jīng)網(wǎng)絡表現(xiàn)得都不差。機器人偶爾將特定的地形區(qū)域誤認為是路徑特征,這導致它偏離航線。研究人員承認,Unity的低質(zhì)量地形包不允許物體之間存在“足夠的差異”。 (他們留待未來探索技術(shù),以提高普遍性,如程序性地生成具有不同條件的地形。)
但他們認為,自己的工作為加速機器人地形導航AI訓練的方法奠定了基礎(chǔ)。
“機器人電池壽命,機器人維修,人體疲勞和安全考慮是手動數(shù)據(jù)采集的主要挑戰(zhàn);然而,通過我們的方法,這些問題可能會被規(guī)避,因為標簽數(shù)據(jù)的生成可以在虛擬環(huán)境中快速有效地執(zhí)行。”研究人員寫道。 “然后機器人可以進行虛擬訓練,以駕馭難以進入和/或危險的地形,包括目前無法訪問的新型地形,甚至從未接觸過這些環(huán)境,并(例如,火星)中收集真實數(shù)據(jù)。”