学术论坛
- 三维感知与显示技术论坛
- 规模化与轻量化协同演进技术论坛
- 文字识别与文档智能论坛
- 智能影像增强与可控内容生成论坛
- 视觉质量感知与评估前沿论坛
- 面向精神健康促进的具身交互智能研究论坛
- 工业视觉智能检测技术前沿论坛
- 情感计算大模型论坛
- 多模态大模型应用安全与生成式人工智能监管论坛
- 人工智能生成艺术论坛
- 流程工业智能视觉感知技术论坛
- NeRF与3DGS智能生成技术探索论坛
- 复杂交通场景感知技术及其前沿应用论坛
- 智能视觉传感信号处理论坛
- 深空探测人工智能技术论坛
- 低代价高质量信息智能获取
- 多模态智能模型安全隐患洞察与防护论坛
- 生物医学成像与人工智能
- 高效视频通信中的语义编码与内容增强
- 具身智能感知交互论坛
- 智能图像感知微系统
- 多模态遥感大模型及应用
- 持续学习的理论与应用论坛
- 空间计算前沿技术论坛
- 开放环境无人驾驶“感-通-算”前沿技术论坛
- 面向具身智能的图像图形技术
- 生成式视频通信
- 大模型复杂场景理解与轻量化应用
- 机器视觉与学习
- 人脑连接图谱与人工智能论坛
- 类脑计算、感知和智能
- 文字识别与文档智能论坛
- 大模型的表征学习与编码通信论坛
高效视频通信中的语义编码与内容增强
论坛简介
近年硬件设备和通信协议的快速发展,切合了用户对数字媒体日益增长的需求,并导致视频总量的爆发式增长。视频格式也在三个维度上并行革新:空间维度,从蓝光到高清以至2K、4K、8K;时间维度,从30fps到60fps甚至120fps;互动维度,从2D到3D再到沉浸式全景视频。视频呈现方式的改善,也间接培育了用户对超高清画质的需求,现有视频内容已占据消费互联网的绝大部分带宽。相对有限的网络带宽和爆发增长的用户需求之间必然存在激烈矛盾。就此,本论坛邀请专家针对有限带宽下的视频语义压缩、编码与画质增强进行探讨,促进观点交流、知识分享与合作创新,进而激发新思维,解决新问题,推动图像视频通信领域的学科发展。
论坛日程
论坛时间:2025年5月9日13:30-15:30
论坛名称:高效视频通信中的语义编码与内容增强
主持人:杨铀,刘文予
论坛主席
- 杨铀华中科技大学 教授个人简介: 杨铀,华中科技大学电子信息与通信学院教授,博导,副院长,中国图象图形学学会图像视频专委会秘书长兼常务委员。主要从事计算成像、多媒体信号处理、多媒体通信方面的研究,近年来主持承担科技部重点研发计划、自然科学基金、国家部委纵向项目、企业委托重大科技创新项目等30余项,发表学术论文140余篇,授权中美发明专利40余项。担任中国科协“应急态势感知与应急通信技术”决策咨询专家团队首席科学家等;2018年当选IET Fellow;担任Journal of Electronic Imaging等4个国际期刊的编委、第三届世界元宇宙大会执行主席、国际会议ICIMCS 2013/ 2014、MMM 2014/2020. ICME 2014、CVRS2015.VCIP2016/2020. 1CASSP2019专题论坛主席、ICIMCS 2016执委会委员等;2019年起担任IET全球创新奖、全国创新争先奖评委等。
- 刘文予CSIG常务理事
华中科技大学 教授个人简介: 刘文予,华中科技大学电信学院二级教授,中国图象图形学学会图像视频通信专委会主任。1986年本科毕业于清华大学计算机系,1991年硕士毕业于华中理工大学电信系,2001年博士毕业于华中科技大学电信系,之后一直于华中科技大学电信学院工作,目前任中国通信学会会士,获湖北省技术发明一等奖、中国图象图形学学会自然科学一等奖、“计算可视媒体”期刊(SCI Q1)2021最佳论文奖。在国际著名期刊和会议发表论文160多篇,谷歌学术总引用次数超3.8万次,H指数70。
论坛讲者信息
- 陶晓明清华大学/新疆大学 教授报告题目: 多模态语义通信报告摘要: 随着数字化社会的加速发展,多媒体数据激增,应用形态丰富,逐渐向多模态方向发展。多模态语义通信成为通信网络领域关注的热点与难题。现有理论方法长期受限于多模态数据表征的语义独立性假设,逐渐遭遇“边际效应”,亟需另辟蹊径。视觉、听觉、语言等多模态数据在语义空间呈现出高度关联特性,这种语义关联性为多模态数据高效表征提供了创新途径,也将直接影响无线通信网络的传输和服务质量。本报告从无线通信网络与多模态数据的本质特征入手,首先介绍多模态语义通信的背景和语义信息的时空关联结构。在此基础上,介绍多模态语义表征与优化理论、多模态语义-信道联合编码方法和语义传输服务质量约束下的协同优化。个人简介: 陶晓明,清华大学研究员,博士生导师。获得国家杰出青年科学基金资助、“中国青年科技奖”和“中国青年女科学家”荣誉称号。 清华大学博士毕业后,在法国电信研发中心工作,2009年回清华大学从事博士后研究,2011年留校工作。主要从事无线多媒体通信、协同通信及关键技术应用研究。作为主要完成人参与获得国家自然科学二等奖、国家技术发明二等奖、IEEE国际会议最佳论文奖等奖项;发表论文70余篇,其中SCI/EI收录65篇,申请发明专利30余项,获授权发明专利19项。1次担任国际会议GeneralCo-Chair,1次国际会议Organization Chair。
- 徐迈北京航空航天大学 教授报告题目: 数据驱动下的压缩视频质量增强报告摘要: 近年来,随着智能终端的发展以及在线视频等新型多媒体业务的普及,网络中所传输的图像视频数据量呈爆炸式增长的趋势,网络带宽供求矛盾日益尖锐,视频编码是网络带宽供求矛盾的关键技术。然而,高压缩比的视频压缩导致视频质量差,极大降低了视频用户体验。本次报告将介绍徐迈课题组在视频质量增强方面的研究工作,主要包括:(1)基于多帧联合优化的压缩视频质量增强技术;(2)面向盲质量增强的动态高效深度网络模型。个人简介: 徐迈,北京航空航天大学电子信息工程学院副院长,教育部长江学者特聘教授。主要研究方向为图像处理、人工智能及其在多媒体、生物医学上的应用。在IJCV、IEEE TPAMI、TMI、TIP等权威期刊和会议上发表论文百余篇,ESI高被引论文10余篇。担任IEEE TIP、TMM编委,连续两年获得IEEE TMM期刊杰出编委奖。主持国家自然科学基金首批原创探索、重点、优青等项目,曾入选青年长江学者。获教育部技术发明一等奖(序1)、北京市自然科学一等奖(序1)、吴文俊人工智能自然科学一等奖(序1)、中国科协求是杰出青年成果转化奖,北京市优秀博士论文指导教师等荣誉。
- 白慧慧北京交通大学 教授报告题目: 复杂环境下图像视频的编码及增强报告摘要: 图像和视频编码及增强技术研究在国家战略、工业应用和学术研究层面都具有重要的科学意义。近年来,随着深度学习理论和其相关技术的成熟,图像视频编码及增强技术得以飞速发展,在诸多领域都有重要的理论指导和应用价值,同时也面临新的挑战。例如海量视频数据在异构网络中传输存在可靠性差的问题,解码重建视频由于复杂降质造成分析任务准确度低的问题等。本报告将重点介绍我们课题组针对上述问题的最新研究工作。个人简介: 白慧慧,北京交通大学教授、博士生导师。主要研究方向是图像视频编码和增强等。已发表包括IEEE Trans及 CVPR等学术论文100余篇。获国际专利授权3项、国家发明专利授权15项。主持国家自然科学基金重点项目、国家重点研发计划战略性科技创新合作项目、北京市自然基金项目等。获北京市自然科学一等奖、北京市科技进步二等奖、中国产学研合作创新成果奖二等奖等。入选北京高等学校“青年英才计划”、微软亚洲研究院“铸星计划”、CCF-腾讯犀牛鸟创意基金、APSIPA Distinguished Lecturers。
- 刘琼华中科技大学 教授报告题目: 沉浸式体积视频时空压缩编码报告摘要: 沉浸式体积视频作为新一代三维视觉计算范式,依托非结构化光场采样与动态神经辐射场重构技术,构建了亚毫米级几何精度与毫秒级动态响应的六自由度交互系统,极大地促进了虚拟现实、增强现实和混合现实的发展。然而,高维时空数据表征带来的海量数据规模给储存带来了很大挑战。针对高维时空信号的高熵编码难题,提出双路径优化框架:(1)多模态神经辐射场压缩架构:基于解耦式隐式神经表征,构建摄像机参数空间、时序帧空间与三维几何空间的张量分解模型,突破传统单视域压缩范式,实现多视域联合优化编码。(2)动态时空高斯表征压缩框架:将经典3D高斯核扩展至四维时空流形,创新性融合时空预测算子与时域一致性稳定约束,构建了具有物理可解释性的动态高斯压缩框架。个人简介: 刘琼,华中科技大学电子信息与通信学院教授,博导。中国图形图象学会女工委委员,中国图形图象学会图像视频通信专委会执行委员,中国计算机学会多媒体专委会执行委员。主要从事视频编码与处理、三维视频感知与理解等方面的研究工作。主持国家自然科学基金、科技部重点研发计划等国家级项目多项。已发表包括IEEE Trans等学术论文70余篇。获国际专利授权15项、中国国家发明专利授权40项。获教育部科技进步二等奖、湖北省技术发明一等奖、中国图象图形学学院技术发明二等奖、教学成果奖二等奖等。参与AVS VRU沉浸式体积视频编码标准、MPEG-MIV沉浸式视频编码标准、MPEG-LVC光场视频编码标准、JVET-EE1等工作,提出三十余项提案。曾任国际期刊IET Image Processing 副主编、及Multimedia Tools and Applications客座编辑。
论坛联系人
- 赵铁松福州大学t.zhao@fzu.edu.cn