企业报告嘉宾

王井东百度计算机视觉首席科学家
- 报告题目：可控人像视频生成：唇动、动作以及人-物交互
  报告摘要：可控人像视频生成有着广泛的应用，面临诸多技术挑战。本报告包含三个方向的研究工作，发表在ECCV 2024，SIGGRAPH Aisa， CVPR等会议上。第一部分主要介绍语音驱动唇形，涉及基于3D人脸网格和端到端的方案。第二部分介绍基于人体关节点控制的肢体动作视频生成。最后，介绍含有人物交互的人像视频生成。
  个人简介： 王井东，百度计算机视觉首席科学家，加拿大工程院外籍院士，IEEE/IAPR 会士，ACM杰出会员。曾任微软亚洲研究院视觉计算组首席研究员。研究领域为计算机视觉、深度学习及多媒体搜索。代表工作包括高分辨率神经网络（HRNet）、基于transformer attention的图像语义分割网络OCRNet、以及基于近邻图的大规模最近邻搜索等。担任IEEE TPAMI、IJCV和ACM TOMM的编委会成员，（曾）担任过许多人工智能会议的领域主席，如 NerIPS、CVPR、ICCV、ECCV、AAAI、IJCAI、ACM MM等，担任ICCV 2025 程序委员会主席。
李静思云眼视界算力云与AI创新事业部负责人
- 报告题目：城市治理专用大模型的机遇与挑战
  报告摘要：介绍在城市治理专用大模型的需求场景，当前面临的问题和挑战，以及云眼视界的研发进展。
黄志洪中科亿海微研究院副院长
报告题目： 大模型时代的可编程推理算力芯片探索
- 报告摘要： 人工智能算法从基于统计学习的方法，发展到以CNN、RNN为代表的深度学习模型，再到以Transformer为代表的大模型的兴起，算法不断更迭，持续创新，对算力也提出了需求和挑战。算力芯片是大模型实现的载体，大模型驱动算力芯片的发展，算力芯片也反过来推进算法模型的进一步升级。典型的推理算力芯片包括GPU、TPU、FPGA、Groq等，有着不同的特色。已有相关探索研究证实FPGA在大模型推理上有着独特的优势，在大模型时代，可编程技术也将有着重要的价值。
  个人简介： 黄志洪，博士，高级工程师，长期从事可编程芯片架构及电路设计研究工作。先后主持及参与国家重大科技专项、国家自然科学基金、中科院重大方向、北京市科技重大专项等项目，在包括IEEE TCAD、Electronics、FPGA等知名期刊及会议发表论文40余篇、授权专利30余项。担任全国微电子研究生学术论坛技术委员会委员，集成电路标准委会AI芯片组成员、科技部入库专家、北京市科技委评审专家等，Springer CSSP、FGCS、VLSIJ、电子与信息学报等期刊及会议审稿人。

王井东百度计算机视觉首席科学家

李静思云眼视界算力云与AI创新事业部负责人

黄志洪中科亿海微研究院副院长

2025中国图象图形大会（CCIG2025）

联系我们

你知道你的Internet Explorer是过时了吗?

王井东 百度计算机视觉首席科学家

李静思 云眼视界算力云与AI创新事业部负责人

黄志洪 中科亿海微研究院 副院长

2025中国图象图形大会（CCIG2025）

联系我们

你知道你的Internet Explorer是过时了吗?

王井东百度计算机视觉首席科学家

李静思云眼视界算力云与AI创新事业部负责人

黄志洪中科亿海微研究院副院长