高效视频通信中的语义编码与内容增强论坛

学术论坛

高效视频通信中的语义编码与内容增强论坛

论坛简介

近年硬件设备和通信协议的快速发展，切合了用户对数字媒体日益增长的需求，并导致视频总量的爆发式增长。视频格式也在三个维度上并行革新：空间维度，从蓝光到高清以至2K、4K、8K；时间维度，从30fps到60fps甚至120fps；互动维度，从2D到3D再到沉浸式全景视频。视频呈现方式的改善，也间接培育了用户对超高清画质的需求，现有视频内容已占据消费互联网的绝大部分带宽。相对有限的网络带宽和爆发增长的用户需求之间必然存在激烈矛盾。就此，本论坛邀请专家针对有限带宽下的视频语义压缩、编码与画质增强进行探讨，促进观点交流、知识分享与合作创新，进而激发新思维，解决新问题，推动图像视频通信领域的学科发展。

论坛日程

论坛时间：2025年5月9日13:30-15:30

论坛名称：高效视频通信中的语义编码与内容增强

主持人：赵铁松

论坛主席

杨铀
华中科技大学教授
个人简介： 杨铀，华中科技大学电子信息与通信学院教授，博导，副院长,中国图象图形学学会图像视频专委会秘书长兼常务委员。主要从事计算成像、多媒体信号处理、多媒体通信方面的研究，近年来主持承担科技部重点研发计划、自然科学基金、国家部委纵向项目、企业委托重大科技创新项目等30余项，发表学术论文140余篇，授权中美发明专利40余项。担任中国科协“应急态势感知与应急通信技术”决策咨询专家团队首席科学家等；2018年当选IET Fellow；担任Journal of Electronic Imaging等4个国际期刊的编委、第三届世界元宇宙大会执行主席、国际会议ICIMCS 2013/ 2014、MMM 2014/2020. ICME 2014、CVRS2015.VCIP2016/2020. 1CASSP2019专题论坛主席、ICIMCS 2016执委会委员等；2019年起担任IET全球创新奖、全国创新争先奖评委等。
刘文予
CSIG常务理事
华中科技大学教授
个人简介： 刘文予，华中科技大学电信学院二级教授,中国图象图形学学会图像视频通信专委会主任。1986年本科毕业于清华大学计算机系，1991年硕士毕业于华中理工大学电信系，2001年博士毕业于华中科技大学电信系，之后一直于华中科技大学电信学院工作，目前任中国通信学会会士，获湖北省技术发明一等奖、中国图象图形学学会自然科学一等奖、“计算可视媒体”期刊（SCI Q1）2021最佳论文奖。在国际著名期刊和会议发表论文160多篇，谷歌学术总引用次数超3.8万次，H指数70。

论坛讲者信息

陶晓明
清华大学/新疆大学教授
报告题目： 多模态语义通信
报告摘要： 随着数字化社会的加速发展，多媒体数据激增，应用形态丰富，逐渐向多模态方向发展。多模态语义通信成为通信网络领域关注的热点与难题。现有理论方法长期受限于多模态数据表征的语义独立性假设，逐渐遭遇“边际效应”，亟需另辟蹊径。视觉、听觉、语言等多模态数据在语义空间呈现出高度关联特性，这种语义关联性为多模态数据高效表征提供了创新途径，也将直接影响无线通信网络的传输和服务质量。本报告从无线通信网络与多模态数据的本质特征入手，首先介绍多模态语义通信的背景和语义信息的时空关联结构。在此基础上，介绍多模态语义表征与优化理论、多模态语义-信道联合编码方法和语义传输服务质量约束下的协同优化。
个人简介： 陶晓明，清华大学研究员，博士生导师。获得国家杰出青年科学基金资助、“中国青年科技奖”和“中国青年女科学家”荣誉称号。清华大学博士毕业后，在法国电信研发中心工作，2009年回清华大学从事博士后研究，2011年留校工作。主要从事无线多媒体通信、协同通信及关键技术应用研究。作为主要完成人参与获得国家自然科学二等奖、国家技术发明二等奖、IEEE国际会议最佳论文奖等奖项；发表论文70余篇，其中SCI/EI收录65篇，申请发明专利30余项，获授权发明专利19项。1次担任国际会议GeneralCo-Chair，1次国际会议Organization Chair。
徐迈
北京航空航天大学教授
报告题目： 数据驱动下的压缩视频质量增强
报告摘要： 近年来，随着智能终端的发展以及在线视频等新型多媒体业务的普及，网络中所传输的图像视频数据量呈爆炸式增长的趋势，网络带宽供求矛盾日益尖锐，视频编码是网络带宽供求矛盾的关键技术。然而，高压缩比的视频压缩导致视频质量差，极大降低了视频用户体验。本次报告将介绍徐迈课题组在视频质量增强方面的研究工作，主要包括：（1）基于多帧联合优化的压缩视频质量增强技术；（2）面向盲质量增强的动态高效深度网络模型。
个人简介： 徐迈，北京航空航天大学电子信息工程学院副院长，教育部长江学者特聘教授。主要研究方向为图像处理、人工智能及其在多媒体、生物医学上的应用。在IJCV、IEEE TPAMI、TMI、TIP等权威期刊和会议上发表论文百余篇，ESI高被引论文10余篇。担任IEEE TIP、TMM编委，连续两年获得IEEE TMM期刊杰出编委奖。主持国家自然科学基金首批原创探索、重点、优青等项目，曾入选青年长江学者。获教育部技术发明一等奖（序1）、北京市自然科学一等奖（序1）、吴文俊人工智能自然科学一等奖（序1）、中国科协求是杰出青年成果转化奖，北京市优秀博士论文指导教师等荣誉。
白慧慧
北京交通大学教授
报告题目： 复杂环境下图像视频的编码及增强
报告摘要： 图像和视频编码及增强技术研究在国家战略、工业应用和学术研究层面都具有重要的科学意义。近年来，随着深度学习理论和其相关技术的成熟，图像视频编码及增强技术得以飞速发展，在诸多领域都有重要的理论指导和应用价值，同时也面临新的挑战。例如海量视频数据在异构网络中传输存在可靠性差的问题，解码重建视频由于复杂降质造成分析任务准确度低的问题等。本报告将重点介绍我们课题组针对上述问题的最新研究工作。
个人简介： 白慧慧，北京交通大学教授、博士生导师。主要研究方向是图像视频编码和增强等。已发表包括IEEE Trans及 CVPR等学术论文100余篇。获国际专利授权3项、国家发明专利授权15项。主持国家自然科学基金重点项目、国家重点研发计划战略性科技创新合作项目、北京市自然基金项目等。获北京市自然科学一等奖、北京市科技进步二等奖、中国产学研合作创新成果奖二等奖等。入选北京高等学校“青年英才计划”、微软亚洲研究院“铸星计划”、CCF-腾讯犀牛鸟创意基金、APSIPA Distinguished Lecturers。
刘琼
华中科技大学教授
报告题目： 沉浸式体积视频时空压缩编码
报告摘要： 沉浸式体积视频作为新一代三维视觉计算范式，依托非结构化光场采样与动态神经辐射场重构技术，构建了亚毫米级几何精度与毫秒级动态响应的六自由度交互系统，极大地促进了虚拟现实、增强现实和混合现实的发展。然而，高维时空数据表征带来的海量数据规模给储存带来了很大挑战。针对高维时空信号的高熵编码难题，提出双路径优化框架：（1）多模态神经辐射场压缩架构：基于解耦式隐式神经表征，构建摄像机参数空间、时序帧空间与三维几何空间的张量分解模型，突破传统单视域压缩范式，实现多视域联合优化编码。（2）动态时空高斯表征压缩框架：将经典3D高斯核扩展至四维时空流形，创新性融合时空预测算子与时域一致性稳定约束，构建了具有物理可解释性的动态高斯压缩框架。
个人简介： 刘琼，华中科技大学电子信息与通信学院教授，博导。中国图形图象学会女工委委员，中国图形图象学会图像视频通信专委会执行委员，中国计算机学会多媒体专委会执行委员。主要从事视频编码与处理、三维视频感知与理解等方面的研究工作。主持国家自然科学基金、科技部重点研发计划等国家级项目多项。已发表包括IEEE Trans等学术论文70余篇。获国际专利授权15项、中国国家发明专利授权40项。获教育部科技进步二等奖、湖北省技术发明一等奖、中国图象图形学学院技术发明二等奖、教学成果奖二等奖等。参与AVS VRU沉浸式体积视频编码标准、MPEG-MIV沉浸式视频编码标准、MPEG-LVC光场视频编码标准、JVET-EE1等工作，提出三十余项提案。曾任国际期刊IET Image Processing 副主编、及Multimedia Tools and Applications客座编辑。

论坛联系人

赵铁松
福州大学
t.zhao@fzu.edu.cn

2025中国图象图形大会（CCIG2025）

联系我们

你知道你的Internet Explorer是过时了吗?