智能影像增强与可控内容生成论坛

学术论坛

智能影像增强与可控内容生成论坛

论坛简介

当前以Stable Diffusion、Sora为代表的生成式大模型在高质量图像视频生成方面取得了显著进展，成为推动人工智能领域发展的核心关键技术之一。这些模型不仅在艺术创作、虚拟现实等领域展现出巨大潜力，也为突破现有影像增强技术的发展瓶颈提供了可能。然而，基于生成式大模型的影像增强方法主要依赖于数据驱动的方式，存在生成内容不可控、生成过程计算代价高昂等问题。因此，高效可控的生成式大模型成为了当前研究的热点。为了更好地推进这一领域的研究，本次论坛将围绕智能影像增强与可控内容生成这一热点问题，邀请业内专家和学者共同探讨当前高效的智能影像增强与可控内容生成的研究进展，旨在为突破现有影像增强与可控内容生成技术的发展瓶颈提供新的思路和解决方案。

论坛日程

论坛时间：2025年5月9日13:30-15:30

论坛名称：智能影像增强与可控内容生成论坛

主持人：潘金山，唐金辉

论坛主席

潘金山
南京理工大学教授
个人简介： 潘金山，南京理工大学计算机科学与工程学院教授、博士生导师；主要从事图像视频复原与增强等相关底层视觉问题的研究；目前在国际权威期刊和会议上发表论文100余篇，谷歌学术引用1.7万余次；研究工作曾获国家优秀青年科学基金、联合基金重点项目等的资助；在历史影像及经典影视修复方面的成果受到新华社、央视综合频道CCTV-1、央视网、央视频等多家媒体报道；目前担任IEEE TPAMI、TMM、CVIU等期刊的编委以及多次担任CVPR、ECCV、NeurIPS、ICML、ICLR等国际会议的领域主席。
唐金辉
南京理工大学教授
个人简介： 唐金辉，南京理工大学、二级教授、计算机学院院长、社会安全信息感知与系统工信部重点实验室主任，国家杰出青年科学基金获得者、国家"万人计划"科技创新领军人才、国际模式识别学会会士（IAPR Fellow）。发表IEEE/ACM汇刊论文和CCF A类会议论文200余篇，谷歌学术引用21000余次，H-index为76，入选ESI高被引论文15篇。

论坛讲者信息

曾铁勇
香港中文大学教授
报告题目： 场景恢复：结合视觉增强和分辨率改进
报告摘要： 复杂成像条件下户外图像的可视性增强一直是计算机视觉的关键任务，并受到越来越多的关注。然而，现有的图像增强方法可能会导致典型的块状伪影或颜色失真。增强任务之后，不良杂质也可能会显著放大，进一步降低图像质量。为了增强和超分辨复杂的现实世界退化，我们提出了一种同时进行视觉增强和分辨率改进（VERI）变分场景恢复模型，用于联合增强图像可视性并提高退化图像的分辨率。具体而言，我们估计退化图像的散射光图以实现干净的场景辐射度，并同时通过深度超分辨率网络寻求高质量图像。半邻近交替方向乘子法（sPADMM）算法用于有效解决所提模型中的最小化问题。大量实验证明了所提方法在处理雾霾、沙尘暴、水下或低照度等各种场景时的有效性和鲁棒性。
个人简介： 曾铁勇，香港中文大学数学人工智能中心主任、数学系教授。科技部战略性科技创新合作重点专项首席科学家，Pattern Recognition 编委会成员，2021年香港数学会青年学者奖获得者。于2000年本科毕业于北京大学，2004年获得巴黎理工学院硕士学位，2007年获得巴黎第十三大学博士学位。2007-2008, 法国巴黎卡尚高等师范学校博士后。2008-2018年，香港浸会大学数学系助理教授、副教授。2018年入职香港中文大学数学系，任副教授、教授。主要研究领域包括数据科学，优化理论，图像处理，反问题等。在优化、图像处理、反问题的国际一流杂志和会议发表两百篇学术论文。
田春伟
西北工业大学副教授
报告题目： 基于跨域知识迁移网络的图像复原方法
报告摘要： 近年来，基于深度学习的图像复原方法通过端到端架构实现了对图像表征的突破性建模，其性能提升但仍受限于双重瓶颈：现有模型依赖海量数据与深层堆叠结构补偿图像退化过程，导致计算复杂度高；深度网络在多层次特征融合过程中易引发显著性特征稀释效应，造成纹理细节与边缘结构不可逆损失。本研究提出跨域知识驱动的图像复原学习框架，通过人类视觉系统的注意力聚焦特性、信号稀疏表示理论、图像处理非局部结构一致性以及判别式学习解耦策略引导深度网络，提取显著的结构信息，以获得复杂场景下稳定的图像复原模型。
个人简介： 田春伟，西北工业大学副教授/博士生导师。博士2021年1月毕业于哈尔滨工业大学。入选2022-2024年全球前2%顶尖科学家榜单、省级人才、西北工业大学翱翔新星。获得国际模式识别领域Top期刊Pattern Recognition最佳论文奖、中国图象图形学学会科学技术奖自然科学奖二等奖（排名第1）、省计算机学会青年科技奖（排名第1）、省计算机学会科学技术奖三等奖（排名第1）。研究方向为视频/图像复原和识别、图像生成等。在IEEE汇刊、Pattern Recognition、Neural Networks和ICASSP等国际期刊/会议上发表论文70余篇。其中，6篇ESI高被引论文（3篇热点论文）、4篇Top期刊封面论文、5篇国际超分辨领域Benchmark List论文、1篇论文技术被美国医学影像公司购买商用应用到CT机上、1篇论文技术应用苹果手机上等。
潘金山
南京理工大学教授
报告题目： 面向图像视频复原的高效特征表示方法
报告摘要： 如何有效地实现细节与结构的协同建模是解决图像视频复原的核心关键。然而，由于低频结构特征以及网络模型结构设计对高频细节信息的频谱压制效应，使得重要细节结构难以恢复。针对这些问题，我们将首先介绍自注意力机制在非局部视觉特征建模中的作用，阐述其在图像视频复原过程中对高频细节特征的作用机制，介绍用于图像细节和结构协同建模的自适应自注意力机制方法；其次，针对生成式模型面临的内容不可控问题，构建退化特征空间与生成式模型潜在特征空间的对齐方法，介绍可控生成式图像复原的相关工作。
个人简介： 潘金山，南京理工大学计算机科学与工程学院教授、博士生导师；主要从事图像视频复原与增强等相关底层视觉问题的研究；目前在国际权威期刊和会议上发表论文100余篇，谷歌学术引用1.7万余次；研究工作曾获国家优秀青年科学基金、联合基金重点项目等的资助；在历史影像及经典影视修复方面的成果受到新华社、央视综合频道、央视网、央视频等多家媒体报道；目前担任IEEE TPAMI、TMM、CVIU等期刊的编委以及多次担任CVPR、ECCV、NeurIPS等国际会议的领域主席。
左旺孟
哈尔滨工业大学教授
报告题目： 可控视频生成与应用
报告摘要： AI视频生成近年来得以快速发展，但在可控性和拓展应用方面仍有许多值得挖掘与探索的空间。本报告一方面从可控性角度出发，介绍视觉生成的后处理增强，提升视频生成的空间布局/动作可控性和物理符合度。另一方面，视频生成的发展与成熟，已可为许多其他相关任务提供基座作用。报告以视频插帧和图像编辑为例，展示视频生成先验可以发挥的作用。
个人简介： 左旺孟，哈尔滨工业大学计算学部教授。主要从事底层视觉、视觉生成、视觉理解和多模态学习等方面的研究。在CVPR/ICCV/ECCV/NeurIPS/ICLR等顶级会议和IEEE T-PAMI、IJCV及IEEE Trans.等期刊上发表论文200余篇。曾任ICCV、CVPR、ECCV等会议领域主席，现任IEEE T-PAMI、T-IP、中国科学-信息科学等期刊编委。

论坛联系人

潘金山
南京理工大学
jspan@njust.edu.cn

2025中国图象图形大会（CCIG2025）

联系我们

你知道你的Internet Explorer是过时了吗?