2025年5月22日,英国高等教育学院Fellow、英国伯明翰大学助理教授焦剑波博士应邀到122cc太阳集团学术交流,并作题为“Visual Understanding in an Open World”的21世纪学科前沿系列在线学术报告。本次报告由122cc太阳集团数据科学与知识工程研究所副所长高广宇副教授主持,吸引了数据科学与知识工程研究所相关研究方向三十余名师生参与。
焦剑波报告以独特的“宇宙-现实-视觉”三层认知框架展开,从浩瀚宇宙的宏观视角逐步聚焦到现实世界的具体场景,最终深入计算机视觉领域,系统性地阐述了开放世界视觉理解的理论基础与技术挑战。通过“斑马与马”、“椅子与长凳”等生动案例,深入浅出地揭示了人类认知与AI系统的本质差异。针对开放世界视觉理解的上述挑战,焦剑波在技术分享环节重点介绍了其团队在开放词汇语义分割范式革新、医疗场景视听建模和全景多模态理解等方面的研究突破,还分享了其团队组织的“全景多模态360+X”的ICCV 2025挑战赛进展,该项目为开放世界视觉理解研究提供了重要的数据集和基准。
报告结束后,参会师生就开放世界视觉理解中的认知关联、大模型技术背景下的开放世界视觉理解挑战等问题与焦剑波老师展开了深入讨论。本次报告不仅拓宽了师生的学术视野,更激发了大家对开放世界理解这一前沿领域的科研热情,为相关研究提供了新的思路和方向。
焦剑波博士简介:焦剑波,英国伯明翰大学助理教授,英国高等教育学院Fellow, 前英国皇家学会Short Industry Fellow,前牛津大学访问学者、博士后,美国UIUC大学访问学者。ICML、NeurIPS、ICLR、ACM MM等国际会议领域主席(AC),TMLR、TCSVT、TVCJ等国际期刊编委(AE)。其研究领域主要围绕机器学习、计算机视觉、医疗影像、AI for Science等,发表50余篇顶级期刊/会议论文。更多信息请见个人主页(https://jianbojiao.com/)及其团队主页(https://mix.jianbojiao.com/)