学术论坛
智能视觉传感信号处理论坛
论坛简介
成像设备在获取原始RAW图后需要对其进行处理,涉及诸如去马赛克、噪声抑制、色彩校正和动态范围优化等任务。随着智能手机、视频监控、自动驾驶等应用对图像传感器采集质量要求的日益提高以及应用场景的多样化和复杂化,传统的图像信号处理器(ISP)无法满足复杂的图像处理需求。智能视觉传感信号处理(AI-ISP)不仅能够更精准地识别并优化图像中的多种元素,如人脸、景物、光线条件等,还能适应不同环境下的拍摄条件,提供更加自然生动的画面效果,显著提升图像的分辨率、清晰度、色彩还原度及动态范围,受到诸多手机厂商的关注。本论坛将邀请在智能视觉传感信号处理领域的知名学者介绍HDR成像、图像复原、图像增强等方面的研究成果及AI ISP的机遇与挑战。
论坛日程
论坛时间:2025年5月9日15:50-17:50
论坛名称:智能视觉传感信号处理论坛
主持人:张盛平,贾旭

8959ec1c60a3c0f1df0bb2517e00f241.png

论坛主席
  • 张盛平-哈尔滨工业大学.png

    张盛平
    哈尔滨工业大学 教授
    个人简介: 张盛平,哈尔滨工业大学长聘教授、鹏城国家实验室访问教授、如本科技首席科学家,布朗大学和香港浸会大学博士后、加州大学伯克利分校访问学者,入选国家级青年人才计划。研究方向为计算机视觉和机器学习。主持国家自然科学基金4项、华为公司项目10余项,被华为授予2021年“HUAWEI Ascend Expert”和 2022年“昇腾众智星光奖”荣誉称号,荣获2022年度教育部-华为“智能基座”栋梁之师。获省部级科研奖励4项。发表论文100余篇(包括PNAS、IEEE T-PAMI、IJCV、ICML、NeurIPS、CVPR、ICCV、SIGGRAPH等)。

  • 贾旭-大连理工大学.jpg

    贾旭
    大连理工大学 副教授
    个人简介: 贾旭,大连理工大学未来技术学院/人工智能学院长聘副教授,辽宁省智能感知与理解人工智能重点实验室骨干成员。研究方向包括视觉内容生成与增强,类脑视觉以及AI4S,在TPAMI、TIP、CVPR、NeurIPS等顶刊和顶会上发表论文50余篇,Google Scholar引用1万余次,申请和授权专利20余项,其中多项应用于华为旗舰手机和自动驾驶平台。主持国自然项目2项和联合重点项目子课题等纵横向项目。研究成果曾获得包括CCF科技成果奖自然科学二等奖、华为火花奖、CVPR国际三维形状补全挑战赛冠军等奖项。为CCF、CSIG和CAAI等多个专委会执委,以及Valse执行领域主席,多次受邀担任ICLR、ICME和IJCAI等领域主席或高级程序委员,并在CVPR、ECCV等顶会上组织多次研讨会。
论坛讲者信息

  • 微信图片_20250417124817.jpg

    熊志伟
    中国科学技术大学 教授
    报告题目: 基于可学习查找表的高效图像处理
    报告摘要: 查找表(LUT)作为一种高效的数据结构,广泛应用于边缘计算设备,如智能手机的图像处理管线(ISP)、高性能加速器(FPGA)等。尽管深度学习近年来在图像处理领域取得了显著进展,但其计算复杂度和硬件需求限制了在边缘计算设备上的应用。不同于一般的神经网络压缩方法,我们探索了深度学习与查找表结合的技术路径。核心思想是利用深度学习模型输出的预测结果填充查找表,通过高效的查找操作替代复杂的矩阵计算,从而兼具深度学习模型的良好性能与查找表的计算优势。基于这一可学习查找表的思路,我们设计了一系列算法,从输入维度、存储内容、以及构造方式等角度全面提升了查找表的建模能力、灵活性以及存储效率。我们将可学习查找表应用于超分辨率、重采样、去噪等任务上,展现了其媲美传统方法的高效性和显著的性能优势
    个人简介: 熊志伟,中国科学技术大学教授、博士生导师。曾任微软亚洲研究院研究员。入选国家创新人才计划青年项目、中科院百人计划、安徽省百人计划。主要研究方向为计算成像与生物医学图像处理,在人工智能领域顶级期刊与会议上发表论文200余篇,谷歌学术引用9000余次。主持国家重点研发计划课题等多个项目。曾获微软学者奖,多媒体领域旗舰会议IEEE VCIP最佳论文奖,以及CVPR/ICCV/ECCV等9项国际会议技术挑战赛冠军。

  • 董超-中国科学院深圳先进技术研究院.jpg

    董超
    中国科学院深圳先进技术研究院 研究员
    报告题目: 通用与智能图像复原算法研究
    报告摘要: 通用大模型正在改变整个人工智能的研究生态,去年我们开发的图像复原大模型SUPIR大幅度提升了图像复原的上限。今年我们利用新开发的控制算法UniCon,推出了第二代图像复原大模型SUPIRv2,将图像复原的效果推上了新的台阶。从智能层面,我们借助语言大模型,让图像质量评价从数值指标变成了语言描述,开发了会讲话的IQA大模型系列DepictQA,DeQA-wild和DeQA-score,它们不仅可以给出逻辑清晰的图像质量描述,还能获得更好的指标分数。最后,作者也将分享他刚刚出版的AI专著《底层视觉之美》。
    个人简介: 董超,博士生导师,中国科学院深圳先进技术研究院研究员,深圳理工大学教授,上海人工智能实验室双聘领军科学家。主要研究方向为底层计算机视觉,包括图像超分辨率、去噪和增强等,发表相关论文100余篇,谷歌引用量超过4万次。2014年,在欧洲计算机视觉大会(ECCV)上发表论文SRCNN,首次将深度学习引入图像超分辨领域。2017年至今,多次带队参加国际图像超分辨率比赛,共获得9项冠军。2016年-2018年就职于商汤科技,带领商汤超分团队开发了世界首款基于深度学习的数码变焦软件。2021年被斯坦福大学评选为世界前2%顶尖科学家。2022年被清华大学评为AI 2000人工智能全球最具影响力学者。2023年获得上海市技术发明一等奖。
  • 微信图片_20250417125037.jpg

    施维俊
    OPPO 多媒体应用专家、高级软件架构师
    报告题目: 移动终端多媒体视效增强技术探索与实践
    报告摘要: 近年来,由于手机处理器算力及能力的快速发展,AI技术在手机中有了较为广泛的应用。尤其在多媒体领域,AI技术被广泛使用图像效果的增强,本次报告将重点介绍在OPPO AI手机中,通过智能编码前处理低码高清、智能视效增强、精细化场景超分,ProXDR图片等技术来改善用户在使用OPPO手机时的媒体视效体验。并结合移动设备对于流畅性、低功耗的诉求,介绍在应用这些技术同时OPPO多媒体领域所做的性能、功耗优化措施。
    个人简介: OPPO多媒体应用专家、高级软件架构师,长期从事多媒体领域工作包括Player、Adaptive Streaming Engine、分布式多媒体框架及媒体体验优化等,参与过HLS,DASH等自适应流媒体引擎在全球的首批商业化,对消费类电子领域的多媒体技术解决方案及产品落地方案,有着大量的设计和实现经验。目前在OPPO平台软件开发中心作为多媒体领域首席SE负责相应领域的架构设计、体验优化及技术课题规划等工作。

  • image.png

    付莹
    北京理工大学 教授
    报告题目: 基于物理启发的复杂光照图像增强与应用
    报告摘要: 在低光、高光及高动态范围等复杂光照环境下,图像采集往往面临噪声增强、细节丢失、过曝及亮度对比过大等问题,影响视觉质量和计算机视觉算法的稳健性。这不仅降低了人眼感知效果,也限制了计算机视觉在医疗诊断、城市监控、遥感探测等领域的应用。本报告基于物理成像原理,剖析复杂光照下的图像退化机制,并介绍一系列基于物理启发的图像增强方法,包括基于噪声建模的低光增强、自适应曝光补偿、局部及全局亮度调整,以及去噪与细节恢复技术。最后,报告将展示这些方法在实际应用中的成功案例,验证其在复杂光照环境下的有效性和实用价值。
    个人简介: 付莹,北京理工大学教授,博士生导师。2017年入选海外高层次青年人才引进计划。主要从事计算机视觉、计算摄像、图像/视频处理等相关领域研究,近五年以第一/通讯作者在中科院一区期刊和计算机机学会推荐A类会议发表论文50余篇,授权发明专利30余项。获计算机学会推荐 A类国际会议ICML杰出论文奖和国际会议PRCV最佳论文奖,主持国家自然科学基金重点项目等国家级项目/课题10余项,获中国指挥与控制学会科学技术进步奖一等奖、人工智能学会教学成果奖励计划一等奖、图象图形学会石青云女科学家奖。

  • 王栋-大连理工大学.jpg

    王栋
    大连理工大学 教授
    报告题目: 多模态视觉目标跟踪探索
    报告摘要: 视觉传感器的发展推动着视觉目标跟踪从单一模态向多模态方向发展。多模态信息的互补性能够提升跟踪算法在复杂环境中应对光照变化、天气条件、遮挡等挑战的潜力,但如何高效地挖掘和融合多模态信息仍具有很大的挑战。本报告将汇报团队近年来针对多模态视觉目标跟踪问题在算法模型、评测数据和统一建模范式等方面的探索,以及对多模态跟踪问题的一些展望。
    个人简介: 王栋, 大连理工大学信息与通信工程学院, 教授、博导。迄今在本领域顶级会议(CVPR/ICCV)及期刊(TPAMI/IJCV)发表论文50余篇, Google Scholar引用1.5万余次。获得国际视觉目标跟踪竞赛VOT冠军(10次)、CCF自然科学二等奖、教育部自然科学二等奖、CVPR2020最佳论文提名等学术奖励。研究工作获得国家自然科学基金优秀青年科学基金、区域联合重点项目等资助。
  • 顾舒航-电子科技大学.png

    顾舒航
    电子科技大学 教授
    报告题目: AI-ISP:面向真实开放场景的终端平台图像复原与增强
    报告摘要: 近年来,基于深度学习的图像复原与增强技术取得了突破性的进展,促进了其在产业界的广泛应用。图像信号处理器(ISP)是成像设备的重要组成部分,需要实时解决光学系统局限性、电子器件局限性以及视觉感知非线性带来的多方面挑战,对于图像增强方法的鲁棒性、灵活性以及高效性具有很高的要求。本报告结合报告人近年来在“基于人工智能的图像信号处理器”(AI-ISP)方面的工程实践,介绍如何通过设计专用硬件架构、高效增强网络结构、高效网络训练方法、感知质量保真图像增强等技术,实现终端平台的鲁棒、灵活、高效图像增强。
    个人简介: 顾舒航,电子科技大学教授,国家级青年人才。博士毕业于香港理工大学,后加入苏黎世联邦理工学院任博士后研究员。长期从事人工智能与计算机视觉方面的研究,主要围绕图像复原与增强、图像压缩、图像生成等底层视觉问题展开研究。发表中科院一区期刊/CCF-A类会议论文50余篇,包括IEEE TPAMI, IJCV, CVPR, ICCV, NeurIPS等。 谷歌学术15000余次,获得北京市自然科学一等奖(第三完成人),吴文俊人工智能奖自然科学一等奖(第三完成人)。曾参与/主导多个底层视觉相关的产业界项目,2020-2022年主管OPPO芯片子公司哲库多媒体AI算法部门,作为核心人员参与6纳米制程的影像外挂芯片与4纳米制程的手机系统级芯片项目。
论坛联系人
  • 张盛平
    哈尔滨工业大学
    s.zhang@hit.edu.cn
参会注册

你知道你的Internet Explorer是过时了吗?

为了得到我们网站最好的体验效果,我们建议您升级到最新版本的Internet Explorer或选择另一个web浏览器.一个列表最流行的web浏览器在下面可以找到.