隨著人機協(xié)作型機器人的廣泛應(yīng)用,通過人機物理交互進(jìn)行機器人運動技能學(xué)習(xí)是人工智能與機器人學(xué)交叉領(lǐng)域的前沿重點研究方向。其目的是利用人工智能技術(shù)從交互經(jīng)驗數(shù)據(jù)中獲得機器人仿人操作技能,并泛化到新的相近任務(wù)或不同環(huán)境中,實現(xiàn)機器人的快速編程和高效適應(yīng),具有廣闊的應(yīng)用前景。然而,現(xiàn)有絕大部分的技能學(xué)習(xí)方法受限于交互數(shù)據(jù)的數(shù)量和維度、參數(shù)的學(xué)習(xí)效率等,僅適用于單步、簡單的操作任務(wù),缺乏考慮復(fù)雜長期操作任務(wù)的應(yīng)用,存在效率低、適應(yīng)性差等瓶頸問題。復(fù)雜長期操作任務(wù)是指機器人執(zhí)行含有多個子目標(biāo),且各子目標(biāo)之間存在強時-空耦合的操作任務(wù),具有步驟多、數(shù)據(jù)量大、數(shù)據(jù)維度高等特點,是機器人運動技能學(xué)習(xí)研究的重點與難點。
圖1 面向復(fù)雜長期操作任務(wù)的機器人運動技能學(xué)習(xí)技術(shù)方案
基于此,廣東省科學(xué)院智能制造研究所機器人技術(shù)團隊提出了一種面向復(fù)雜長期操作任務(wù)的機器人運動技能高效學(xué)習(xí)方法。該方法引入稀疏高斯過程和變分推斷進(jìn)行運動技能的建模與學(xué)習(xí),能夠在任務(wù)精度保障下大幅度降低計算時間復(fù)雜度,提升學(xué)習(xí)效率,使機器人從大規(guī)模高維交互數(shù)據(jù)中進(jìn)行運動技能學(xué)習(xí)成為可能。同時,研究人員提出含有先驗均值的多輸出高斯過程對新情形的運動約束進(jìn)行協(xié)同建模,實現(xiàn)相近任務(wù)或不同環(huán)境下給定起始、中間、目標(biāo)路徑點等約束時技能模型的精準(zhǔn)調(diào)整和高效適應(yīng)。該方法已在動態(tài)復(fù)雜環(huán)境下機器人執(zhí)行多個急停按鈕的按壓任務(wù)中進(jìn)行了理論驗證,并在物流倉儲等領(lǐng)域進(jìn)行了應(yīng)用測試,有效提升復(fù)雜長期操作任務(wù)下機器人的編程與部署效率。
相關(guān)成果發(fā)表于國際權(quán)威期刊《IEEE Transactions on Automation Science and Engineering》,吳鴻敏博士為第一作者,廣東省科學(xué)院智能制造研究所為第一單位。
論文信息
H. Wu, W. Yan, Z. Xu, T. Cheng, X. Zhou. (2021) A Framework of Robot Skill Learning from Complex and Long-horizon Tasks. IEEE Transactions on Automation Science and Engineering, 1-11.
論文鏈接:https://ieeexplore.ieee.org/abstract/document/9625636
(省科學(xué)院智能制造研究所/供稿)