学术论坛
生成式视频通信
论坛简介
生成式人工智能技术的范式性突破正深刻重塑全球科技版图,其在内容生成等领域的变革性成果已引发学术界和产业界的广泛关注。然而,作为数字化时代核心交互载体的视频通信领域,尚未充分释放生成式技术的革命性潜能——从多媒体内容表征范式的重构、编码传输机理的智能化演进,到端到端通信系统的自适应优化,均存在亟待探索的理论盲区与技术瓶颈。本论坛汇集领域资深专家学者,深度解读生成式技术的发展趋势,系统分析其对多媒体表达、编码、传输、评价等领域的实际应用价值。论坛构筑人工智能、多媒体、通信等领域的跨界合作桥梁,期望凝聚各方智慧,加速生成式人工智能技术在视频通信领域的落地应用,并为相关专家学者打造务实高效的交流平台。
论坛日程
论坛时间:2025年5月10日13:30-15:30
论坛名称:生成式视频通信
主持人:张文军,鲁国
论坛主席

  • 张文军-上海交通大学.jpg

    张文军
    上海交通大学、讲席教授
    个人简介: 张文军,上海交通大学讲席教授、电子工程系图像通信与网络工程研究所所长,教育部未来媒体网络协同创新中心主任。主要从事图像编码与通信、媒体网络融合、宽带无线传输、视听电子系统芯片设计等领域技术研究。国家自然科学基金委数字媒体通信创新群体带头人、杰出青年基金获得者,教育部首批长江学者特聘教授,国家百千万工程领军人才,国务院特殊津贴专家,中国电子学会会士,IEEE Fellow。合作发表SCI论文140余篇、获得授权发明专利236项(含35项国际发明专利),主编工信部“十四五”规划教材《视频通信》。以第一完成人获得国家科技进步二等奖4项、中国专利金奖、何梁何利科技进步奖和广电行业CCBN学术贡献奖等荣誉。

  • 鲁国-上海交通大学.jpg

    鲁国
    上海交通大学、副教授
    个人简介: 鲁国,上海交通大学电子工程系长聘教轨副教授、博士生导师。2020年博士毕业于上海交通大学,主要研究方向是视频编码。在IEEE T-PAMI/T-IP及CVPR/ECCV/ICCV等上发表论文50余篇。作为项目负责人先后承担自然基金委青年、面上以及华为、平头哥等企业项目,参与自然基金重点、科技部重点研发计划项目等。担任权威期刊IJCV,IEEE T-CSVT客座编辑,在 CVPR/ACMMM 上组织多次智能编码讲座,担任AAAI-2022 Senior PC。入选中国科协青年人才托举工程,获首届IEEE视觉信号处理与通信新星奖,中国图象图形学学会优秀博士论文奖,上海交通大学优秀博士论文奖。
论坛讲者信息

  • 朱文武-清华大学.jpg

    朱文武
    清华大学 教授
    报告题目: 面向动态开放环境的生成式AI
    报告摘要: 生成式AI旨在通过人工智能技术创造文本、图像、视频等内容,在机器翻译、艺术创作等多个领域都得到了广泛应用。近年来,基于预训练的大语言模型和扩散模型等更是极大促进了对生成式AI的发展。然而,预训练大模型通常难以满足动态变化的用户需求,因此研究面向动态开放环境的生成式AI变得尤为重要。首先介绍生成式AI发展现状,然后探讨动态开放环境下生成式AI研究的关键科学问题, 围绕动态开放环境下多主体、多行为、多场景以及多视角协同的可控生成难题,提出一系列基于解耦不变学习的生成式AI模型,并对其关键技术进行探讨。最后,本报告讨论生成式AI的未来研究方向。
    个人简介: 朱文武,清华大学计算机系教授,信息科学与技术国家研究中心副主任。曾任国家973计划项目首席科学家,国家基金委重大项目负责人,教育部人工智能科技创新专家组成员等。先后担任IEEE Transactions on Multimedia主编、IEEE Transactions on Circuits and Systems for Video Technology主编,曾任IEEE Transactions on Multimedia 指导委员会主席。ACM Fellow、IEEE Fellow、AAAS Fellow、SPIE Fellow、欧洲科学院外籍院士。获2023年ACM SIGMM技术成就奖和2024年IEEE电路与系统学会Charles A. Desoer技术成就奖。三次获国家自然科学二等奖。
  • 赵耀-北京交通大学.jpg

    赵耀
    北京交通大学 教授
    报告题目: 人机共友好的深度视频编码
    报告摘要: 随着网络化数字媒体时代的到来,图像视频的传输量已经达到网络信息传播总量的80%以上,对图像视频数据的高效压缩成为必然。经过几十年的发展,混合预测/变换编码方法已经取得良好的性能,许多编码标准已经被开发并广泛应用于各种场景,如 MPEG1/2/4、H.261/2/3 和 H.264/AVC、AVS 系列、 H.265/HEVC 、H.266/VVC等。传统的编码技术主要服务于人类的视觉需求,然而,随着视频监控设备在世界各地(特别是我国)的广泛布设,越来越多的视频数据不仅要面向人类使用,更要面向机器使用。因此,重新定义和设计既能服务于人又有利于机器视觉任务的图像视频编解码技术迫在眉睫!本报告将介绍课题组的最新科研课题《人机共友好的深度视频编码》的研究目标、研究思路和技术方案,并介绍实验室在基于深度学习的图像视频编码与分析方面的部分进展。
    个人简介: 赵耀,男,博士,北京交通大学教授,教育部长江学者特聘教授、国家杰出青年科学基金获得者、万人计划科技创新领军人才、IEEE Fellow、IET Fellow。现任 “科幻音视频智能处理”北京市重点实验室主任,“视觉智能交叉创新”教育部国际合作联合实验室主任。研究领域为数字媒体信息处理与智能分析,包括图像\视频压缩,数字媒体内容安全,媒体内容分析与理解,人工智能,无人驾驶等。主持了科技创新2030–新一代人工智能专项项目、973计划、863计划等课题30余项。在包括IEEE Trans.等国内外期刊、会议上发表论文200余篇。作为第一完成人获世界互联网大会领先科技奖以及北京市科学技术奖一等奖、中国图像图形学学会科学技术奖一等奖、高等学校自然科学奖一等奖等省部级奖励5项。指导的博士生8人获北京市和中国计算机学会等优秀博士论文奖。受邀担任了 IEEE Transactions on Cybernetics、IEEE Transactions on Circuits and Systems for Video Technology等多个国际杂志编委。他是国务院学科评议组成员,科技部重点研发计划“云计算与大数据”专项总体组专家。

  • 雷建军-天津大学.jpg

    雷建军
    天津大学 教授
    报告题目: 3D视频智能编码与处理
    报告摘要: 人类生活的世界是3D立体的,由于受技术条件的限制,传统的显示技术采用2D平面影像表达和传递对世界的认识。继黑白、彩色、高分辨率信息在屏幕上完美再现之后,3D视频技术成为了新一代信息技术的发展方向和趋势。3D视频能够再现真实景物的立体信息,提供沉浸式的立体视觉感受和灵活的交互式体验,在多个领域都具有广阔的应用前景。报告将介绍3D视频系统与视频编码基本原理、阐述3D视频智能编码与处理方法。
    个人简介: 雷建军,天津大学讲席教授,国家杰出青年科学基金获得者。主要研究方向包括视频编码、3D视频处理、计算机视觉等。主持承担了国家重点研发计划项目、国家自然科学基金重点项目、国家国际科技合作项目课题、天津市人工智能重大专项课题等;发表IEEE Trans汇刊长文60余篇;担任IEEE Transactions on Vehicular Technology、Neurocomputing、China Communications、电子学报编委;获天津市科技进步一等奖、天津市技术发明一等奖、国家技术发明二等奖,入选了天津市中青年科技创新领军人才、天津市131人才工程、北洋学者计划。

  • 陈敏-华为.jpg

    陈敏
    华为公司,视频工程部部长
    报告题目: 大模型时代的视频领域挑战与机遇
    报告摘要: 大模型时代下视频技术领域正经历前所未有的变革。本次报告将重点从产业视角分享视频生成、视频编创与视频传输在大模型时代面临的挑战与机遇。有别于传统PGC/UGC制作方式,生成式AI能大幅提升视频生成效率,然而生成式视频在时间一致性、物理规律遵循和细节保真度方面等仍面临中大挑战,尤其是在长视频生成时更为明显。视频编创领域,大模型已开始理解视频叙事结构,能实现智能剪辑、自动配乐和内容摘要,但在把握叙事逻辑和情感层次上仍不及人类专业编辑。另一方面,爆炸式增长的生成式视频内容对网络传输带来巨大压力,特别是在分布式多用户协同视频编创以及实时交互大模型应用中,如何保证视频的高保真和实时性是关键挑战。本报告也会发布视频生成、视频编创与视频传输领域的产业难题。
    个人简介: 陈敏,华为公司2012实验室中央媒体技术院视频工程部部长。
论坛联系人
  • 鲁国
    上海交通大学
    luguo2014@sjtu.edu.cn
参会注册

你知道你的Internet Explorer是过时了吗?

为了得到我们网站最好的体验效果,我们建议您升级到最新版本的Internet Explorer或选择另一个web浏览器.一个列表最流行的web浏览器在下面可以找到.