学术论坛
- 人工智能生成艺术论坛
- 复杂交通场景感知技术及其前沿应用论坛
- 文字识别与文档智能论坛
- 三维感知与显示技术论坛
- 视觉质量感知与评估前沿论坛
- 流程工业智能视觉感知技术论坛
- 情感计算大模型论坛
- 持续学习的理论与应用论坛
- 智能影像增强与可控内容生成论坛
- 多模态智能模型安全隐患洞察与防护论坛
- 空天探测成像前沿论坛
- 高效视频通信中的语义编码与内容增强论坛
- 智能图像感知微系统论坛
- 面向精神健康促进的具身交互智能研究论坛
- 工业视觉智能检测技术前沿论坛
- 面向具身智能的图像图形技术
- 生物特征识别论坛
- 大模型的表征学习与编码通信论坛
- 大模型复杂场景理解与轻量化应用论坛
- 视频动作理解与生成前沿论坛
- 生物医学成像与人工智能论坛
- 开放环境无人驾驶“感-通-算”前沿技术论坛
- 智能视觉传感信号处理论坛
- NeRF与3DGS智能生成技术探索论坛
- 深空探测人工智能技术论坛
- 生成式视频通信论坛
- 类脑计算、感知和智能论坛
- 多模态大模型应用安全与生成式人工智能监管论坛
- 多模态遥感大模型及应用论坛
- 机器视觉与学习论坛
- 具身智能感知交互论坛
- 规模化与轻量化协同演进技术论坛
- 空间计算前沿技术论坛
- 人脑影像图谱与人工智能论坛
- 低代价高质量信息智能获取论坛
- 工业具身智能感知前沿论坛
机器视觉与学习论坛
论坛简介
机器学习是一门从已知数据中探寻未知规律和模式的艺术,如何以更少的代价取得更好的学习效果始终是其亟待解决的核心问题。随着机器学习技术在视觉等领域的发展和应用,传统学习算法在逐步向前迭代的同时,各式深度学习方法也在不断推陈出新,本次Workshop我们将邀请领域专家作为讲者,分享他们在该领域的最新工作,总结机器视觉与学习领域在相关核心问题上的近期进展和展望未来值得探索的方向。
论坛日程
论坛时间:2025年5月10日15:50-17:50
论坛名称:机器视觉与学习
主持人:林宙辰,王奕森
论坛主席
- 林宙辰CSIG理事
北京大学 教授个人简介: 林宙辰,北京大学教授,IAPR/IEEE/CSIG Fellow,国家杰青,中国图象图形学学会机器视觉专委会主任,中国自动化学会模式识别与机器智能专委会副主任。研究领域为机器学习、 数值优化。发表论文 300 余篇,英文专著2本。获2020年度CCF科学技术奖自然科学一等奖。多次担任机器学习与人工智能顶级会议 CVPR、ICCV、NIPS/NeurIPS、ICML、IJCAI、AAAI 和 ICLR 的领域主席,曾任 IEEE T. Pattern Analysis and Machine Intelligence 编委,现任International J. Computer Vision、 Optimization Methods and Software 编委。 - 王奕森北京大学 助理教授个人简介: 王奕森,北京大学助理教授,博士生导师。主要研究方向为机器学习理论和算法,目前重点关注大模型的理论、安全等。已发表机器学习三大顶会ICML/NeurIPS/ICLR文章60余篇,多篇被选为Oral或Spotlight,获ECML 2021最佳机器学习论文奖、ICML 2024 Workshop最佳论文奖、ICML 2021 Workshop最佳论文银奖、CVPR 2021竞赛第一等。谷歌学术引用1万余次。主持科技创新2030新一代人工智能重大项目课题、基金委重大研究计划等项目。
论坛讲者信息
- 宋明黎浙江大学 教授报告题目: AI助力病理学:基础模型在肿瘤诊断与分析中的应用报告摘要: 病理诊断作为恶性肿瘤的“金标准”,面临主观性强、误诊率高、医生短缺及资源不均等挑战。AI可提升诊断效率、精准性和客观性,助力破解临床困境。本报告主要介绍团队围绕恶性肿瘤筛查、诊断及预后全流程,结合生物标志物挖掘,开发病理诊断与预后分析大模型,并推动临床转化应用。前期相关成果获得CCTV-1焦点访谈、浙江卫视、人民日报、新华社、中国日报等上百家主流媒体广泛报道。个人简介: 宋明黎,浙江大学求是特聘教授、博士生导师、视觉感知教育部-微软重点实验室副主任,入选国家“万人计划”科技创新领军人才,主要从事计算机视觉、人工智能与图机器学习领域研究。先后承担国家自然科学基金重点项目、面上项目、国家重点研发计划、国家国际科技合作专项、浙江省重大专项等国家级和省部级科研项目,发表论文300余篇,连续多年入选Elseiver中国高被引学者、斯坦福全球前2%顶尖科学家榜单。研究成果先后获得2014、2020、2024年浙江省科学技术一等奖,2023年中国人工智能学会吴文俊科技进步一等奖。
- 张兴义安徽大学 教授报告题目: 进化机器学习和机器学习辅助的进化计算报告摘要: 机器学习和进化计算是人工智能领域的两大技术,该报告将首先分别简单介绍这两大技术的优缺点,然后重点介绍两大技术相互结合的研究成果,分别称为进化机器学习和机器学习辅助的进化算法。个人简介: 张兴义,男,博士,二级教授,博士生导师,IEEE Fellow,享受国务院特殊津贴,长江学者特岗教授(人工智能),“国家优青”、“安徽省杰青”。现为安徽大学计算机科学与技术学院党委书记、“计算智能与信号处理教育部重点实验室”主任。研究领域为多目标进化优化及应用、复杂网络认知计算、人工智能方面等。主持科技部2030人工智能重大专项课题1项,国家自然科学基金联合基金重点项目1项,国家自然科学基金面上项目2项等国家级项目,以及省部级项目多项。在国内外学术刊物上发表论文200余篇,国际具有重要影响力的期刊或会议论文60余篇,并获得了计算智能领域顶级期刊IEEE TEVC的2018年度、2021年度及2024年度最佳论文奖等多项奖项。现为多国际期刊编委。
- 王耀威哈尔滨工业大学(深圳) 教授报告题目: 视觉基础模型及数字视网膜应用实践报告摘要: 近年来,国家社会经济的高速发展,多种类型的摄像头得到快速部署,汇聚形成海量视频图像数据亟待处理,大规模视频智能感知处理问题成为各中大型城市各行业智能化发展面临的重大挑战。鹏城实验室团队构建了鹏城·大圣视觉模型,提供了一种强泛化性视觉表征的新范式,并基于视觉基础模型和数字视网膜架构构建了多层次多粒度的城市感知网。目前,已在多类场景任务中部署,突破了城市级视频实时“感知”、“智能”处理的瓶颈问题,将推动行业的智能化升级。个人简介: 王耀威,哈尔滨工业大学(深圳)教授、博士生导师,鹏城实验室视觉智能研究所所长,国家高层次人才,享受国务院政府特殊津贴专家。致力于大规模视频智能感知领域研究,在顶级国际期刊/会议发表论文百余篇,获授权专利50余项,曾承担国家/省部级项目20余项,曾获国家技术发明二等奖、中国电子学会科技进步一等奖和技术发明一等奖、广东省科技进步奖特等奖。担任IEEE TCSVT副编辑、IEEE数字视网膜系统工作组主席、新一代人工智能产业技术创新战略联盟 AI 标准工作组“数字视网膜系统”专题组组长,牵头制定数字视网膜端边云协同技术系列标准。
- 李勇清华大学 教授报告题目: 城市世界模型:进展与思考报告摘要: 近年来,城市世界模型研究在生成式人工智能驱动下取得显著突破。本报告将介绍UrbanWorld通过多模态技术路径(OSM数据转换、MLLM场景规划、扩散模型渲染)实现了高真实感3D城市环境的自动化生成,提高几何一致性与视觉多样性,为AI代理训练与城市规划提供了高效工具。进一步,探索通过“next-token预测”城市多智能体运动生成验证其基于大规模时空序列建模的扩展潜力。二者的结合探索城市世界模型发展的两大方向:静态环境生成与动态行为模拟的深度融合,将建立兼顾城市功能逻辑与人类行为规律的仿真框架,为智慧城市与自动驾驶提供更鲁棒的虚拟试验场。个人简介: 李勇,清华大学电子系长聘教授、博士生导师,教育部长江学者。长期从事城市科学与计算方面的科研工作,在Nat. Sustain.、Nat. Mach. Intell.、Nat. Hum. Behav.、Nat. Cities等自然子刊发表论文多篇,在ICLR、NeurIPS、KDD、WWW等CCF A类国际会议和期刊发表学术论文100余篇,文章引用28000余次,6次获国际会议最佳论文/提名奖。先后入选全球“高被引科学家”名单、国家“万人计划”青年拔尖人才计划,获IEEE ComSoc亚太区杰出青年学者奖、教育部科技进步一等奖、湖北省技术发明一等奖、电子学会科技进步一等奖、电子学会自然科学二等奖、吴文俊人工智能优秀青年奖等。
- 王奕森北京大学 助理教授报告题目: 大模型自我反思能力的理论分析报告摘要: 大语言模型(LLM)在某些情况下具备纯粹通过自我反思提升能力的潜力,即通过自我审查来修正先前的回答。然而,目前尚不清楚这一能力如何产生。本次报告中从上下文学习的视角理论分析自我反思,表明在LLM能给予相对准确的自我评估作为奖励时,它们能够在上下文中进行对齐。值得注意的是,我们的理论构建超越了关于线性Transformer的简化理论,揭示了现实Transformer设计中多头注意力、MLP模块在自我反思中的关键作用。个人简介: 王奕森,北京大学助理教授,博士生导师。主要研究方向为机器学习理论和算法,目前重点关注大模型的理论、安全等。已发表机器学习三大顶会ICML/NeurIPS/ICLR文章60余篇,多篇被选为Oral或Spotlight,获ECML 2021最佳机器学习论文奖、ICML 2024 Workshop最佳论文奖、ICML 2021 Workshop最佳论文银奖、CVPR 2021竞赛第一等。谷歌学术引用1万余次。主持科技创新2030新一代人工智能重大项目课题、基金委重大研究计划等项目。
- 熊龙飞珠海金山办公软件有限公司 研发总监报告题目: 《WPS AI洞察》报告摘要: 大模型AI应用已经蓬勃发展了两年多,各家公司都基于大模型做了丰富的应用形态。WPS作为生产力工具,AI功能主要聚焦在办公内容创作、阅读、数据处理等工作、学习的提效上。随着WPS探索众多AI应用形态,逐渐形成AIGC、Copilot、Insight三个重点方向的AI战略。这次分享主要从Insight这个方向为例,介绍WPS AI的业务思考方式,以及通过相关技术架构、方案的分享来引起讨论,促进产学研交流。个人简介: 熊龙飞:男,研究生毕业于德国基尔大学,电子信息科学与技术专业,研究生主要研究领域为:BCI(脑机接口)和图像处理,参与发表两篇SCI收录的IEEE EMBC文章。有过三次创业经历,2019年11月加入金山办公,现为金山办公技术总监,组建了CV团队。负责OCR、文档识别和理解、PDF编辑、扫描等多个重点项目的研发管理工作。实现了全球第一个移动端拍照弯曲矫正功能,版式还原实现了行业领先的效果。目前版式还原已在扫描件PDF转化、拍照扫描、PDF编辑、双层PDF等多个业务上应用。申请专利二十余篇,其中六篇已获得授权。2021年起任中国图象图形学学会《文档图像分析与识别专委会》专业委员,为国际PDF组织企业成员,《珠海欧美同学会》和《珠海市海归青年交流促进会》会员。2021年带领团队获得金山办公技术大奖一等奖,2021年荣获金山办公和金山集团双料十佳员工。2022年获得“珠海创新创业好青年”称号。2022年指导金山队伍获得CSIG中国图象图形挑战赛小票识别赛道冠军和总决赛冠军。
论坛联系人
- 王奕森北京大学yisen.wang@pku.edu.cn