一架自動駕駛的無人機載有水以幫助撲滅內華達山脈的野火,這可能會遇到旋轉的聖安娜風,威脅要將其推開。迅速適應這些未知的干擾功能,對無人機的飛行控制系統提出了巨大的挑戰。
為了幫助這樣的無人機留在目標上,麻省理工學院的研究人員開發了一種新的,基於機器的自適應控制算法,它可以將其偏離其預期的軌蹟的偏差,這是面對諸如狂風之類的不可預測的力量。
與標準方法不同,新技術不需要對自動駕駛無人機編程的人員提前了解這些不確定乾擾的結構。取而代之的是,控制系統的人工智能模型從從15分鐘的飛行時間收集的少量觀察數據中學習了所有需要了解的東西。
重要的是,該技術會自動確定應使用哪種優化算法來適應干擾,從而改善了跟踪性能。它選擇了最適合該無人機面臨的特定乾擾幾何形狀的算法。
研究人員使用稱為元學習的技術訓練他們的控制系統,以同時完成這兩項事情,該技術教授該系統如何適應不同類型的擾動。
綜上所述,這些成分使其自適應控制系統比模擬中基線方法的軌跡跟踪誤差降低了50%,並且在訓練過程中沒有看到的新風速更好。
將來,儘管有強風或監測國家公園的火災區域,但這種自適應控制系統可以幫助自主無人機更有效地提供沉重的包裹。
納維德·阿茲扎安(Navid Azizan)說:“通過利用元學習,我們的控制者可以自動做出最適合快速適應的選擇。” (蓋子),以及該控制系統論文的高級作者。
Azizan由Aeronautics and Actronautics系研究生Sunbochen Tang和首席作者Sunbochen Tang加入,以及電氣工程和計算機科學系研究生Haoyuan Sun。該研究最近在Dynamics and Control會議上進行了介紹。
找到正確的算法
通常,控制系統結合了一個對無人機及其環境進行建模的函數,並包含有關潛在干擾結構的一些現有信息。但是,在充滿不確定條件的現實世界中,通常不可能事先對這種結構進行設計。
許多控制系統使用基於流行優化算法(稱為梯度下降)的適應方法來估計問題的未知部分,並確定如何使無人機在飛行過程中盡可能靠近其目標軌跡。但是,梯度下降只是可供選擇的較大算法家族中的一種算法,稱為鏡下降。
“鏡下降是算法的一般家族,對於任何給定的問題,這些算法之一可能比其他算法更合適。遊戲的名稱是如何選擇適合您問題的特定算法。在我們的方法中,我們可以自動化此選擇,” Azizan說。
在他們的控制系統中,研究人員用神經網絡模型替換了包含一些潛在干擾結構的功能,該模型學會了從數據中近似它們。這樣,他們就不需要先前的風速結構,而無人機可能會提前遇到。
他們的方法還使用算法在從數據中學習神經網絡模型的同時自動選擇正確的鏡像散文函數,而不是假設用戶已經選擇了理想的功能。研究人員為該算法提供了一系列可供選擇的功能,並且發現最適合當前問題的功能。
唐補充說:“選擇一個良好的距離發電函數來構建正確的鏡像探測適應性,這對於獲取正確的算法以減少跟踪誤差很重要。”
學習適應
儘管無人機可能遇到的風速可能會在每次飛行時都會改變,但控制器的神經網絡和鏡像功能應保持不變,以便每次都不需要重新計算它們。
為了使他們的控制器更加靈活,研究人員使用元學習,教給它以適應訓練期間的一系列風速家庭。
唐解釋說:“我們的方法可以應付不同的目標,因為使用元學習,我們可以通過數據有效地從不同的方案中學習共享表示形式。”
最後,用戶為控制系統提供了目標軌跡,並且它可以實時持續重新估算無人機應如何產生推力,以使其盡可能接近該軌跡,同時容納不確定的干擾。
在模擬和現實世界實驗中,研究人員表明,與基線方法相比,在他們測試的每種風速時,他們的方法導致軌跡跟踪誤差明顯少得多。
Azizan補充說:“即使風擾比我們在訓練中看到的要強得多,我們的技術仍然可以成功處理它們。”
此外,隨著風速的加劇,其方法優於基線的邊距不斷增長,表明它可以適應具有挑戰性的環境。
該團隊現在正在進行硬件實驗,以在風險和其他干擾不同的情況下對真實無人機進行控制系統。
他們還想擴展其方法,以便可以立即處理多個來源的干擾。例如,換風速度可能會導致無人機攜帶的包裹的重量在飛行中移動,尤其是當無人機攜帶有效載荷時。
他們還想探索持續的學習,因此無人機可以適應新的干擾,而無需在迄今為止看到的數據中重新訓練。
“納維德(Navid)和他的合作者已經開發了突破性的工作,將元學習與常規適應性控制結合在一起,從數據中學習非線性特徵。其方法的關鍵是使用鏡像下降技術,這些技術是利用問題的基本幾何形狀,以先前的藝術的方式無法做出的工作,並且他們的工作無法為不確定的環境而造成重要的工作。 Bohn不參與這項工作的加州理工學院電氣工程,計算與數學科學教授。
這項研究部分得到了Mathworks,MIT-IBM Watson AI實驗室,MIT-Amazon Science Hub和MIT-Google計算創新計劃的支持。