光明实验室学术沙龙丨强化学习方法，及其在异构多机系统围捕任务研究上的应用

发布时间：2023-06-27
作者：光明实验室
浏览：3983次

实验室简介

人工智能与数字经济广东省实验室（深圳）（以下简称光明实验室）为省政府批准筹建的第三批广东省实验室之一，经市政府批准已设立为事业单位。实验室面向人工智能与数字经济的重大战略需求，由广东省政府统筹规划及顶层设计，深圳市政府主导建设、运营与管理，深圳大学作为牵头建设单位。实验室致力于打造人工智能与数字经济全链条创新平台、数字经济区域开放产学研合作平台、创新人才聚集和培养的基地以及核心技术成果转化和孵化平台。在此建设目标下，实验室遵循“创新、责任、进取、合作”的核心价值观，主要围绕区块链与金融科技、智能传感与精准医疗、机器学习与智能系统、泛在感知与智慧城市四个方向展开研究。

讲座内容简介

异构多机器人系统是一种由不同构型机器人的团队（如无人机团队，移动小车团队和四足机器人团队）构成的系统，因其具有根据任务需求自主改变单体角色功能和整体配合策略的泛化特性，现已成为我国和世界多机器人系统发展研究的前沿课题。当规划与敏捷控制方法存在鲁棒性和可拓展性缺陷时，异构机器人系统的适用性和规模会受到限制。现有的方法具有规划决策效率低等缺陷，导致系统对环境动态变化响应慢、适应性差，严重约束了多机自主协同的应用推广。演讲人在前期多篇相关工作当中提出了一种基于多智能体强化学习的方法来解决异构机器人团队在不同任务中合作决策的问题。其基本原理是在使用压缩过的感知模型进行输入，结合非对称博弈机制和基于课程学习机制的奖励函数分配来激励不同构型机器人团队之间在围捕任务中下产生智能合作行为。研究团队通过训练期间融合不对称自我博弈和课程学习提出的框架，在模拟和真实世界约束条件下成功完成异构多机器人团队捕捉任务，并为未来大规模智能安全与救援异构多机器人团队提供了方向。

汇报人简介

高源博士，硕士毕业于赫尔辛基大学，博士毕业于瑞典乌普萨拉大学，师从IEEE Fellow Danica Kragnic教授和Ginevra Castellano教授，现为深圳市人工智能与机器人研究院助理研究科学家，科研项目负责人，深圳市海外高层次孔雀人才，孔雀团队核心成员。高源博士曾参与瑞典SSF，欧盟Harizon2020， ANIMATAS等机器人研究项目，现为国家科技部重点研发项目“动态开放环境下基于5G的异构多机器人自主协同技术”的子课题主要参与人（重点专项，2020YFB1313300），参与过程中在林天麟教授的领导下负责带领组员在机器人会议和期刊上发表文章。同时高源博士正在主持负责广东省“基于图表征多智能体强化学习的大规模智能异构多机器人系统研究” （AB01202202005）和深圳市人工智能与机器人研究院“异构多机器人强化学习与规划-从仿真到实现”项目（AC01202101103），负责在林天麟教授的带领下指导团队成员研究异构系统集群特征。高源博士专注于机器人学习和多机器人系统领域研究，特别是在基于强化学习的机器人智能学习系统，多机器人协作，多传感器融合等方面积累深厚，曾在IEEE T-RO、IEEE T-MECH, ACM IMWUT、IEEE RA-L、NIPS、ICRA、IROS等顶尖国际期刊及会议发表论文余30余篇。

讲座信息

时间：2023年6月28日下午 14：30-16：30

地址：光明区科润大厦10楼光明实验室 1012会议室

腾讯会议：606 153 565

上一篇：光明实验室学术沙龙成功举行丨强化学习方法，及其在异构多机系统围捕任务研究上的应用

下一篇: 首战告捷！我室泛在感知团队ARMS组荣获中国机器人及人工智能大赛国赛资格