智能决策与控制技术研究团队在具身智能研究中取得新进展

发布时间：2024-10-28 发布者：肖晔来源：电气学院浏览次数：1656

灵巧手交互是具身智能领域的一个重要研究方向，尽管此前基于模型的控制方法可以在固定环境中实现较好的效果，但在实际实现过程中，传统方法会受到各种各样的因素的制约，如未知的非结构环境和复杂的灵巧手运动学、动力学建模等。

近日，上海电机学院智能决策与控制技术研究团队提出了一种新的数据驱动的机器人灵巧手抓取方法。相关研究结果以“Grasp with push policy for multi-finger dexterity hand based on deep reinforcement learning”为题，发表在人工智能领域重要期刊《Applied Soft Computing》（IF 7.2，中国科学院一区Top期刊）上。我校为论文第一单位，李保江老师为第一作者，在读硕士生邱圣杰为第二作者，我校已毕业硕士生柏基波（目前在上海理工大学攻读机器人领域博士学位）为第三作者，王海燕老师为唯一通讯作者。

在与外部环境交互时，机器人面临着各种挑战，包括在杂乱环境中受到干扰以及难以准确定位目标物体。然而，面对复杂的非结构化环境时，人手往往能从容应对：推动能重新排列杂乱物品的物体、定位目标物体并为手指创造空间；抓取动作可以实现不相关物体的精确移动，与推动动作相辅相成。受此启发，为了使灵巧手能够在复杂环境中执行精确的抓取任务，智能决策与控制技术研究团队为机器人灵巧手提出了一种新的数据驱动抓取方法：推抓策略。该方法将人类抓取与无模型深度强化学习相结合，实现了机器人的协作抓取能力。该方法首先训练一个端到端的条件转换器抓取网络，该网络将视觉点云输入转化为动作输出。使用DQN算法进行策略训练，并通过微调方法进一步增强实际学习效果。实验结果表明，推动-抓取策略显著提高了抓取性能，协作抓取的成功率提高了8%。值得注意的是，这种微调方法大大减少了实际训练时间，真实环境的训练时间只占模拟环境的五分之一。即使在以混乱和复杂为特点的苛刻场景中，该方法也能促进快速学习。这项研究为有效解决涉及多指灵巧手和人机交互的复杂挑战提供了新的见解，对具身智能研究具有借鉴意义。

智能决策与控制技术研究所成立于2019年，依托学校控制科学与工程一级学科，根据国家中长期发展规划、行业需求及未来科技发展趋势，研究定位于机器人智能决策与控制领域，目前专注于具身智能操控技术（感知与认知、决策、控制、执行）的理论与应用研究。团队核心成员包括1名教授，1名副教授，4名讲师。团队在读硕士研究生约30名，已毕业研究生有3人升学攻读博士学位（上海理工大学、天津大学、南京航空航天大学）。截止2024年10月，团队承担国家级项目1项，发表SCI论文25篇（Top期刊论文7篇），获得发明专利授权8项，获得学科竞赛国家级奖项2项。（供稿：电气学院）

论文链接：

https://www.sciencedirect.com/science/article/abs/pii/S1568494624011396

智能决策与控制技术研究团队在具身智能研究中取得新进展

最新导读