光明实验室学术沙龙成功举行丨强化学习方法，及其在异构多机系统围捕任务研究上的应用

发布时间：2023-06-29
作者：光明实验室
浏览：3502次

为拓展实验室各团队的学术视野，促进团队间学术交流，2023年6月28日，光明实验室在科润大厦10楼会议室举办了主题为“强化学习方法，及其在异构多机系统围捕任务研究上的应用”的学术沙龙。汇报人由深圳市人工智能与机器人研究院助理研究科学家、科研项目负责人高源博士担任，实验室成果转化部部长张博副教授主持学术沙龙。

为方便更多学术爱好者参与讲座，本次学术沙龙继续沿用线上线下相结合的理念形式，通过腾讯会议平台进行了全程直播，实验室及各高校师生线上线下积极参会交流。

学术沙龙现场，高源博士表示，异构多机器人系统是一种由不同构型机器人的团队（如无人机团队，移动小车团队和四足机器人团队）构成的系统，因其具有根据任务需求自主改变单体角色功能和整体配合策略的泛化特性，现已成为我国和世界多机器人系统发展研究的前沿课题。然而，现有的方法具有规划决策效率低等缺陷，导致系统对环境动态变化响应慢、适应性差，严重约束了多机自主协同的应用推广。

对此，高源博士及其研究团队提出了一种基于多智能体强化学习的方法来解决异构机器人团队在不同任务中合作决策的问题。例如通过研究在动态干扰物场景下的，动态大规模机器人规划问题，以解决动态场景下高抽象化点模拟多机器人系统在路径规划与避障任务下存在的动态多机器人不确定性问题；以及研究在动态干扰物场景下的，名为“工作机器人-补给机器人”的异构多机器人系统的多机器人覆盖问题，在大规模覆盖任务中，引入一个具有移动能力的能量与物料充足的补给机器人，从而有效地提高整个异构多机器人系统的效率。研究团队通过训练期间融合不对称自我博弈和课程学习提出的框架，在模拟和真实世界约束条件下成功完成异构多机器人团队捕捉任务，并为未来大规模智能安全与救援异构多机器人团队提供了方向。

随后，参会人员与高源博士进行了问答互动，就复杂的地表环境下的机器人协同、道路对机器人的约束、如何构建与实际场景对应的仿真场景等相关问题行了深入探讨。高源博士为提问者给予了详细解答并提出可行性建议，促进了观点的碰撞与新想法、新思路的启发。

光明实验室自成立以来，定期邀请顶尖科学家前来开展学术沙龙活动，分享各领域优秀科研成果及创新型技术。实验室执行主任于非院士期望通过交流科研进展，能够做到夯实技术基础，拓宽技术能力，使得光明实验室从起步阶段就处于技术领域前沿的站位高度。

图/文丨李沛昱

编辑丨李沛昱

上一篇：光明实验室加入光明科学城宣传联盟，助力打造光明科学城良好形象

下一篇: 光明实验室学术沙龙丨强化学习方法，及其在异构多机系统围捕任务研究上的应用