学术论坛
- 三维感知与显示技术论坛
- 规模化与轻量化协同演进技术论坛
- 文字识别与文档智能论坛
- 智能影像增强与可控内容生成论坛
- 视觉质量感知与评估前沿论坛
- 面向精神健康促进的具身交互智能研究论坛
- 工业视觉智能检测技术前沿论坛
- 情感计算大模型论坛
- 多模态大模型应用安全与生成式人工智能监管论坛
- 人工智能生成艺术论坛
- 流程工业智能视觉感知技术论坛
- NeRF与3DGS智能生成技术探索论坛
- 复杂交通场景感知技术及其前沿应用论坛
- 智能视觉传感信号处理论坛
- 深空探测人工智能技术论坛
- 低代价高质量信息智能获取
- 多模态智能模型安全隐患洞察与防护论坛
- 生物医学成像与人工智能
- 高效视频通信中的语义编码与内容增强
- 具身智能感知交互论坛
- 智能图像感知微系统
- 多模态遥感大模型及应用
- 持续学习的理论与应用论坛
- 空间计算前沿技术论坛
- 开放环境无人驾驶“感-通-算”前沿技术论坛
- 面向具身智能的图像图形技术
- 生成式视频通信
- 大模型复杂场景理解与轻量化应用
- 机器视觉与学习
- 人脑连接图谱与人工智能论坛
- 类脑计算、感知和智能
- 文字识别与文档智能论坛
- 大模型的表征学习与编码通信论坛
大模型的表征学习与编码通信论坛
论坛简介
结构信息的表征识别致力于挖掘数据内在的结构化信息,以此实现对真实场景的表征、理解与生成。作为文本、语音、图像、视频等多模态数据处理与分析的核心基础,这一技术极大推动了多模态大模型面向更高层次的认知与决策智能的演进与发展。与此同时,多模态大模型的崛起,正逐渐颠覆传统以无差错比特传输为目标的保真通信模式,转向面向认知的智能通信范式,旨在实现信源表示编码与网络通信传输的端到端统一。本论坛旨在汇聚视觉大数据、类脑智能、多媒体通信等领域的专家学者,共同探讨多模态大模型的表征学习及其在编码通信中的前沿应用等交叉研究领域的最新进展与未来趋势。通过深入的学术交流与思想碰撞,期望推动多模态表示学习与编码通信在理论、技术和方法上的创新与突破。
论坛日程
论坛时间:2025年5月9日15:50-17:50
论坛名称:大模型的表征学习与编码通信论坛
主持人:赫然,李成林
论坛主席
-
赫然中国科学院自动化研究所 研究员个人简介: 赫然,中科院自动化所多模态人工智能系统全国重点实验室研究员,IAPR/IEEE Fellow。从事人工智能、模式识别和计算机视觉研究。承担国家青年科学基金ABC类以及北京杰出青年科学基金等项目。在本领域国际主流期刊TPAMI和IJCV上发表论文23篇,第一作者11篇论文引用过百;研究工作获CAAI技术发明一等奖、CSIG自然科学一等奖、北京市科技进步二等奖等。指导学生获得IEEE SPS最佳青年论文奖、ICPR最佳科学论文奖、北京市优秀博士论文、中科院优秀博士论文、IEEE生物特征理事会优秀博士论文。曾/现任IEEE TIFS副主编、IEEE TIP资深编委、TPAMI/TCSVT/TBIOM/IJCV/PR/TMLR和自动化学报等国内外期刊编委。2019年受邀参加庆祝中华人民共和国成立70周年大会天安门广场观礼。
-
李成林上海交通大学 教授个人简介: 李成林,上海交通大学教授,主要研究:多媒体信号处理与通信、强化学习、联邦学习。发表TPAMI、JSAC等IEEE Transactions长文40余篇,NeurIPS、ICML、CVPR、ACM MM等人工智能、计算机视觉、多媒体领域国际著名会议论文80余篇;授权国家发明专利30余项(2017年获中国专利优秀奖)、美国专利7项、软件著作权1项;主持国家自然科学基金优秀青年项目、联合重点项目、面上项目、青年项目,以及上海市启明星项目等;获德国洪堡学者、微软学者、ACM MM国际会议Top Paper Award,以及中国电子学会自然科学一等奖,上海市技术发明一等奖,吴文俊人工智能科技进步二等奖等;担任IEEE TSIPN期刊Associate Editor、ACM MM 2022年国际会议Area Chair、IEEE MMSP 2026年国际会议Program Chair、中国电子学报英文版期刊青年编委等。
论坛讲者信息
-
王亮CSIG副理事长
中国科学院自动化研究所 研究员报告题目: 大模型时代下的多模态计算报告摘要: 报告将首先回顾多模态计算的历史背景,并重点介绍多模态大模型的发展历程以及当前面临的主要挑战。然后,详细介绍课题组在多模态大模型方面的最新研究成果,包括多模态大模型知识增强、知识蒸馏、知识编辑以及性能评估等。最后,将从数据、模型、功能、安全、效率等多个方面展望未来可能的发展趋势。个人简介: 王亮,中国科学院自动化研究所研究员,博导,国家杰青,IEEE/IAPR/CIE/CCF/CAAI/CSIG Fellow。目前是多模态人工智能系统全国重点实验室副主任,中国计算机学会计算机视觉专委会副主任,中国图象图形学学会副理事长及视觉大数据专委会主任等。担任IEEE TPAMI、IEEE TIP等国际知名期刊的编委、MIR的副主编,曾是IEEE TIFS、IEEE TSMC-B、PR等国内外学术期刊的编委,以及10余次国内外会议的大会、程序或组织主席等。主要从事计算机视觉、模式识别、机器学习、数据挖掘等相关领域的研究。截至目前,已申请或授权发明专利80余项,出版编专著10余部,已发表或接收论文400余篇,获得5项国内外会议最佳论文奖。目前,谷歌学术引用50000余次,H-index是104(2014-2024连续入选ESI中国高被引科学家名单)。 -
姜育刚复旦大学 教授报告题目: 多模态世界模型:感知、生成、决策报告摘要: 多模态世界模型通过整合视觉、文本、声音等多种信号,能够准确地捕捉环境信息、理解物体关联,并对未来进行预测,进而支撑具身智能体在物理世界的可靠作业,其被认为是通往强人工智能的关键技术。本报告介绍复旦大学视觉与学习团队在感知、生成、决策等多模态世界模型核心方向上的最新进展,并展望未来发展趋势。个人简介: 姜育刚,复旦大学副校长,可信具身智能研究院院长,上海市智能视觉计算协同创新中心主任,IEEE/IAPR/CCF Fellow。研究领域为多媒体信息处理、计算机视觉、具身智能、可信人工智能,主持新一代人工智能国家科技重大专项、国家重大科研仪器研制项目等。发表的300余篇论文被引用3万余次,构建的数据集如THUMOS、FCVID和WildDeepfake被国内外学者及企业频繁使用,研发的应用系统多次服务国家关键领域的重要任务,多项成果在重点企业转化实施成效显著。以第一完成人获2023年度国家自然科学二等奖和3项教育部或上海市一等奖。
-
耿新东南大学 教授报告题目: 本能、进化、创意——“学习基因”带来的新质AI能力报告摘要: 以大模型为代表的当代AI技术在学习、搜索、优化、博弈、理解、表达等不同维度上的能力不断取得突破,部分正在接近甚至超越人类。在此背景下,探讨与人类智能相比,是否还有AI 尚未触及或者表现很弱的能力,是一个非常有趣的话题。为了让机器像人一样学习,我们提出一种受到人类智能遗传进化机制启发的全新大模型技术框架——学习基因。进一步,我们初步探索了如何通过学习基因给AI带来新质能力,包括本能、进化和创意。个人简介: 耿新,东南大学首席教授,研究生院常务副院长,新一代人工智能技术与交叉应用教育部重点实验室主任,国家杰青、优青基金获得者,国际工程与技术学会杰出会士,江苏特聘教授。主要从事机器学习、模式识别、计算机视觉等方面的研究。曾获国家自然科学二等奖、国家级教学成果一等奖、科学探索奖等多项教学、科研奖励。现任国务院学位委员会计算机学科评议组成员,教育部高校计算机类专业教指委人工智能专家委员会委员,中国计算机学会理事,江苏省计算机学会副理事长,亚太国际人工智能会议指导委员会委员。
-
熊红凯上海交通大学 教授报告题目: 多媒体大模型的数学思想与编码通信报告摘要: 报告会从信息科学和数学物理的角度,阐述深度神经网络与大模型的数学原理和技术思想,进而介绍:生成、扩散、几何深度学习、联邦学习、大模型的微调,主要是从统计的角度;最后,会介绍大模型的编码和发展,展望智能与信息科学最新的研究和交叉方向。个人简介: 熊红凯,上海交通大学特聘教授(二级教授),国家杰青(2014),长江学者(2016),万人领军人才(2017),IEEE / AAIA Fellow,中国电子学会会士,国家自然科学基金委信息学部专家咨询委员会委员,中国图象图形学学会理事、中国计算机学会杰出会员,上海市优秀学术带头人。作为第一完成人,曾获:上海市青年科技杰出贡献奖、上海市科技进步一等奖、上海市技术发明一等奖、中国电子学会自然科学一等奖。主要研究:信号处理、信息论与编码、多媒体通信、机器学习等。共发表SCI、EI 论文380余篇,包括:TPAMI 等IEEE Trans著名汇刊论文100余篇,ICML、NeurIPS、ICLR等顶级学术会议论文等60余篇;获授权中国、美国发明专利80余项。主持:国家自然基金重点项目6项、原创探索项目、海外及港澳合作项目等;先后获华为最佳创新合作奖、优秀合作奖;培养学生,获国家杰青、国家优青、青年长江、青年拔尖、洪堡学者、美国NSF Career Award等。在上海交通大学组建“媒体信息网络”研究所(http://min.sjtu.edu.cn)。
论坛联系人
-
李成林上海交通大学LCL1985@sjtu.edu.cn