光明实验室学术沙龙成功举行丨一网通吃:跟踪与分割大一统
  • 发布时间:2022-09-27
  • 作者:光明实验室
  • 浏览:2263次


为鼓励优秀学术成果的交流,促进思想碰撞与协同创新,2022年9月26日上午10点,人工智能与数字经济广东省实验室(深圳)(以下简称光明实验室)在科润大厦10楼会议室举办了第4期学术沙龙。本次学术沙龙主题为“一网通吃:跟踪与分割大一统”,汇报人由国家杰出青年基金获得者、科技部中青年创新领军人才,大连理工大学创新学院院长卢湖川教授担任,对如何通过一个统一框架实现多个跟踪任务开展研讨。光明实验室执行主任于非院士到会指导交流并主持本次学术沙龙。


为方便更多学术爱好者参与,本次学术沙龙继续沿用线上线下相结合的理念形式,通过腾讯会议平台进行了全程直播,并收获线上线下热烈的反响。



会上,卢教授对四个跟踪问题(SOT、MOT、VOS、MOTS)的特性进行了详细介绍。卢教授表示,目标跟踪(Object tracking)是计算机视觉的基本任务之一,根据不同的应用场景,目标跟踪问题主要分为SOT(Single object tracking,单目标跟踪)、VOS(Video object segmentation,视频对象分割)、MOT(Mutiple object tracking,多目标跟踪)与MOTS(Mutiple object tracking and segmentation,多目标跟踪与分割)四个独立的任务。多数跟踪方法仅针对其中一个或部分任务,优点是精准,但是若要同时实现四个任务,则需要四套网络参数和算力的消耗,成本较为高昂。如果能用一个网络实现多任务处理,就能够带来内存和算力的节省。然而由于被跟踪物体的特性不同,SOT可以跟踪任意类别的一个或几个目标,而MOT则是跟踪几十个甚至上百个特定类别的实例;SOT 需要将目标与背景进行区分,MOT 则需要将当前目标与之前的轨迹相匹配,等等。因此,想要实现多任务的统一,也需要面临不小的挑战。


对此,卢教授团队提出了一个目标跟踪解决方案,称为 Unicorn。Unicorn主要有三个模块:统一输入和骨干、统一嵌入、统一头部。三个模块分别负责获得强大的视觉表示、建立精确的对应关系、检测不同的跟踪目标。Unicorn 旨在通过统一的网络,将上述四个任务统一起来,从而实现“一网通吃”。



讲座结束后,卢湖川教授与光明实验室参会人员、国内外线上参与者们进行了问答互动,就Unicorn的算法效率、网络复杂性等问题进行了深入探讨与交流。整场学术沙龙互动积极,氛围浓厚。



光明实验室自成立以来,定期邀请顶尖科学家前来开展学术沙龙活动,分享各领域优秀科研成果及创新型技术。实验室执行主任于非院士期望通过交流科研进展,能够做到夯实技术基础,拓宽技术能力,使得光明实验室从起步阶段就处于技术领域前沿的站位高度。




实验室简介


人工智能与数字经济广东省实验室(深圳)(以下简称光明实验室)为省政府批准筹建的第三批广东省实验室之一,经市政府批准已设立为事业单位。实验室面向人工智能与数字经济的重大战略需求,由广东省政府统筹规划及顶层设计,深圳市政府主导建设、运营与管理,深圳大学作为牵头建设单位。实验室致力于打造人工智能与数字经济全链条创新平台、数字经济区域开放产学研合作平台、创新人才聚集和培养的基地以及核心技术成果转化和孵化平台。在此建设目标下,实验室遵循“创新、责任、进取、合作”的核心价值观,主要围绕区块链与金融科技、智能传感与精准医疗、机器学习与智能系统、泛在感知与智慧城市四个方向展开研究。


文丨李沛昱


图丨李沛昱  翟雪岩