发布时间:2022-11-10
作者:光明实验室
浏览:2903次
光明实验室于非院士和明仲教授团队提交的一篇论文Multi-Constraint Deep Reinforcement Learning for Smooth Action Control(用于平滑动作控制的多约束深度强化学习)被人工智能国际顶级学术会议International Joint Conference on Artificial Intelligence (IJCAI 2022)收录,并在大会上做报告。IJCAI,即国际人工智能联合会议,是人工智能领域中重要的学术会议之一,每年吸引全球学术界和企业界逾千人参加。中国计算机学会(CCF)的国际学术会议排名将IJCAI列为人工智能领域A类会议。今年,该会议共收到来自全球研究者的4535篇投稿,经过两阶段的严格筛选,最终约15%的论文被会议方录用。
强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习中重要的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题,广泛用于阿尔法围棋(AlphaGo)、自动驾驶、游戏等领域。但是,目前的强化学习算法通常会遇到动作抖动问题,特别是在连续控制问题中。
为了解决这个问题,本文提出了一种新的方法来整合奖励中动作的平滑度。具体来说,我们引入子奖励并添加多个约束与这些子奖励有关。此外,我们提出了一种多约束近端策略优化(MCPPO) 方法求解多约束DRL 问题。试验结果表明,本文所提出的方法与传统方法相比具有更好的动作流畅度,应用前景广泛。
MCPPO的网络架构
原文详见:
www.ijcai.org/proceedings/2022/0528.pdf
实验室简介
人工智能与数字经济广东省实验室(深圳)(以下简称光明实验室)为省政府批准筹建的第三批广东省实验室之一,经市政府批准已设立为事业单位。实验室面向人工智能与数字经济的重大战略需求,由广东省政府统筹规划及顶层设计,深圳市政府主导建设、运营与管理,深圳大学作为牵头建设单位。实验室致力于打造人工智能与数字经济全链条创新平台、数字经济区域开放产学研合作平台、创新人才聚集和培养的基地以及核心技术成果转化和孵化平台。在此建设目标下,实验室遵循“创新、责任、进取、合作”的核心价值观,主要围绕区块链与金融科技、智能传感与精准医疗、机器学习与智能系统、泛在感知与智慧城市四个方向展开研究。
扫码关注我们
人工智能与数字经济广东省实验室(深圳)
官方网站:http://www.gml.ac.cn
招聘联系:hr_office@gml.ac.cn