学术论坛
- 三维感知与显示技术论坛
- 规模化与轻量化协同演进技术论坛
- 文字识别与文档智能论坛
- 智能影像增强与可控内容生成论坛
- 视觉质量感知与评估前沿论坛
- 面向精神健康促进的具身交互智能研究论坛
- 工业视觉智能检测技术前沿论坛
- 情感计算大模型论坛
- 多模态大模型应用安全与生成式人工智能监管论坛
- 人工智能生成艺术论坛
- 流程工业智能视觉感知技术论坛
- NeRF与3DGS智能生成技术探索论坛
- 复杂交通场景感知技术及其前沿应用论坛
- 智能视觉传感信号处理论坛
- 深空探测人工智能技术论坛
- 低代价高质量信息智能获取
- 多模态智能模型安全隐患洞察与防护论坛
- 生物医学成像与人工智能
- 高效视频通信中的语义编码与内容增强
- 具身智能感知交互论坛
- 智能图像感知微系统
- 多模态遥感大模型及应用
- 持续学习的理论与应用论坛
- 空间计算前沿技术论坛
- 开放环境无人驾驶“感-通-算”前沿技术论坛
- 面向具身智能的图像图形技术
- 生成式视频通信
- 大模型复杂场景理解与轻量化应用
- 机器视觉与学习
- 人脑连接图谱与人工智能论坛
- 类脑计算、感知和智能
- 文字识别与文档智能论坛
- 大模型的表征学习与编码通信论坛
文字识别与文档智能论坛
论坛简介
近年来,大模型技术在图像与自然语言处理等领域取得突破,为文字识别与文档智能技术的发展注入强大动力。大模型显著提升了对复杂字体、多语种以及低质量文档图像的识别能力。同时,其在文档理解、信息抽取和文档问答等方面展现出强大的潜力,为文档智能领域开辟了广阔的应用场景。本次论坛旨在汇聚学术界和产业界的专家,共同探讨文字识别与文档智能领域的前沿技术与产业应用。论坛将促进技术交流,加速科研成果转化,推动金融、医疗、教育和政务等领域的智能化升级。通过此次论坛,进一步推动人工智能与文档智能技术的深度融合,打造一个科技与产业共赢的创新生态。本次论坛计划设置panel环节。
论坛日程
论坛时间:
论坛名称:文字识别与文档智能论坛
主持人:殷绪成,郭丰俊
论坛主席
- 殷绪成北京科技大学 教授个人简介: 殷绪成,教授、博导,模式识别与人工智能专家,国家杰出青年科学基金项目获得者、科技创新2030——“新一代人工智能”重大项目首席科学家,北京科技大学计算机与通信工程学院院长、模式识别与人工智能技术创新实验室主任,中国图象图形学学会文档图像分析与识别专委会主任。主要研究领域包括模式识别、文字识别、计算机视觉、人工智能芯片、工业智能与工业软件技术及应用,在中国计算机学会推荐国际期刊和会议上发表论文一百多篇,曾获获北京市科技进步一等奖、中国电子学会科技进步一等奖、中国人工智能学会吴文俊人工智能奖技术发明一等奖。
- 郭丰俊上海合合信息科技股份有限公司 研发总监个人简介: 郭丰俊毕业于上海交通大学,系模式识别与智能系统博士,CSIG文档图像分析与识别专委会常务委员,上海市图像图形学学会理事。长期从事文字识别,图像处理、计算机视觉及内容安全方向研究。近年来,郭丰俊带领团队获得过ICDAR19大会表格检测竞赛冠军,中国图象图形学会2021年度科技进步二等奖等奖项,获CSIG2022中英文购物小票信息理解大赛冠军、第三届CSIG图像图形技术挑战赛决赛总冠军、ICDAR2023文档图像篡改检测竞赛冠军、2024全球AI攻防挑战赛篡改检测赛道冠军。现任合合信息图像算法研发总监。
论坛讲者信息
- 金连文华南理工大学 教授报告题目: AGI时代的光学文字识别:大模型技术及延伸报告摘要:个人简介: 金连文,男,华南理工大学二级教授,兼任中国图象图形学学会(CSIG)常务理事、广东省图象图形学会理事长、广东省高校音视频图文智能信息处理工程研究中心主任等职。主要研究领域为文字识别、文档图像理解、计算机视觉、多模态大模型等,在重要学术期刊及国际会议上发表论文300余篇(其中SCI一区+CCF A类论文100余篇),Google Scholar论文被引用数16000余次,H-Index 68。2024年入选国际模式识别协会(IAPR)Fellow。获省部级科技奖5项(其中一等奖2项,二等奖3项);指导学生参加国际国内知名学术技术竞赛并荣获冠军20余次。
- 周宇南开大学 教授报告题目:报告摘要:个人简介: 周宇,南开大学计算机/网安学院教授、博导。研究方向为计算机视觉、多模态人工智能、自然语言处理及深度学习等,近期聚焦于可视文字处理/检测/识别/理解/安全(OCR)、多模态大模型(含理解与生成)、终身学习、自监督学习等主题。研发的场景文字提取系统、特定目标检测系统、钓鱼网站检测系统等应用于多个国家部委及企业,发挥关键作用。在国内外高水平会议及期刊如发表学术论文近80篇,其中近5年在CCF-A类/SCI一区会议期刊发表论文30余篇,主持国家重点研发计划课题&子课题、国家自然科学基金面上&青年基金项目、国家部委重大工程课题、中国博士后科学基金、企业委托等项目/课题20 余项,累计经费近2000万。
- 武亚强联想研究院 研究员报告题目: AIGC时代的文档理解技术及应用报告摘要:个人简介: 武亚强,联想集团高级总监,研究院主任研究员。长期致力于行业人工智能技术和应用研发,研究人工智能在教育,办公,车等领域的落地应用。主要技术方向包括智能人机交互,多媒体智能等。在基于多设备自然融合交互、多媒体技术等领域已授权海内外发明专利百余项,带领团队在文档类国际学术竞赛中获得过十多次冠军,曾获CCF科技进步一等奖、产学研创新成果一等奖、北京市科技进步二等奖和吴文俊科技进步二等奖等。
- 连宙辉北京大学 副教授报告题目: 汉字书法的理解生成及其应用报告摘要:个人简介: 连宙辉,北京大学王选计算机研究所副教授、博士生导师,中国文字字体设计与研究中心副主任,入选国家级青年人才计划和北京市科技新星计划。研究领域为计算机图形学、计算机视觉与人工智能,主要研究方向是面向文字的图形图像生成、三维视觉,在领域重要期刊(TOG, TPAMI, IJCV等)和会议(SIGGRAPH/SIGGRAPH Asia, CVPR, NeurIPS等)上发表论文90余篇。多次担任NeurIPS、CVPR、ICCV、ICML等国际会议领域主席,担任《Pattern Recognition》、《计算机辅助设计与图形学学报》等国内外重要期刊编委,获北京市技术发明奖二等奖(排名1)、中国专利优秀奖(排名1)、ICRA2024服务机器人最佳论文候选、吴文俊人工智能优秀青年奖、北京大学-中国光谷成果转化奖等奖励。
- 陆大公上海合合信息科技股份有限公司 技术专家报告题目: 大模型时代的篡改检测:挑战、机遇与治理实践报告摘要:个人简介: 陆大公毕业于复旦大学电子通信系,现任上海合合信息科技股份有限公司图像算法技术专家,专注于图像处理、计算机视觉及内容安全领域的前沿研究,带领团队获得ICDAR2023文档图像篡改检测竞赛冠军、2024全球AI攻防挑战赛篡改检测赛道冠军。依托合合信息自主研发的篡改检测系统,团队已联合中国信通院等单位编写了《文本图像篡改检测系统技术要求》行业标准,并入选中国信通院《护证计划》首批技术支撑单位。
论坛联系人
- 杨春北京科技大学chunyang@ustb.edu.cn