企业报告嘉宾
  • 王井东 百度计算机视觉首席科学家
    • 报告题目:可控人像视频生成:唇动、动作以及人-物交互
      报告摘要:可控人像视频生成有着广泛的应用,面临诸多技术挑战。本报告包含三个方向的研究工作,发表在ECCV 2024,SIGGRAPH Aisa, CVPR等会议上。第一部分主要介绍语音驱动唇形,涉及基于3D人脸网格和端到端的方案。第二部分介绍基于人体关节点控制的肢体动作视频生成。最后,介绍含有人物交互的人像视频生成。
      个人简介: 王井东,百度计算机视觉首席科学家,加拿大工程院外籍院士,IEEE/IAPR 会士,ACM杰出会员。曾任微软亚洲研究院视觉计算组首席研究员。研究领域为计算机视觉、深度学习及多媒体搜索。代表工作包括高分辨率神经网络(HRNet)、基于transformer attention的图像语义分割网络OCRNet、以及基于近邻图的大规模最近邻搜索等。担任IEEE TPAMI、IJCV和ACM TOMM的编委会成员,(曾)担任过许多人工智能会议的领域主席,如 NerIPS、CVPR、ICCV、ECCV、AAAI、IJCAI、ACM MM等,担任ICCV 2025 程序委员会主席。
  • 李静思 云眼视界算力云与AI创新事业部负责人
    • 报告题目:城市治理专用大模型的机遇与挑战
      报告摘要:介绍在城市治理专用大模型的需求场景,当前面临的问题和挑战,以及云眼视界的研发进展。
  • 黄志洪 中科亿海微研究院 副院长
    报告题目: 大模型时代的可编程推理算力芯片探索
    • 报告摘要: 人工智能算法从基于统计学习的方法,发展到以CNN、RNN为代表的深度学习模型,再到以Transformer为代表的大模型的兴起,算法不断更迭,持续创新,对算力也提出了需求和挑战。算力芯片是大模型实现的载体,大模型驱动算力芯片的发展,算力芯片也反过来推进算法模型的进一步升级。典型的推理算力芯片包括GPU、TPU、FPGA、Groq等,有着不同的特色。已有相关探索研究证实FPGA在大模型推理上有着独特的优势,在大模型时代,可编程技术也将有着重要的价值。
      个人简介: 黄志洪,博士,高级工程师,长期从事可编程芯片架构及电路设计研究工作。先后主持及参与国家重大科技专项、国家自然科学基金、中科院重大方向、北京市科技重大专项等项目,在包括IEEE TCAD、Electronics、FPGA等知名期刊及会议发表论文40余篇、授权专利30余项。担任全国微电子研究生学术论坛技术委员会委员,集成电路标准委会AI芯片组成员、科技部入库专家、北京市科技委评审专家等,Springer CSSP、FGCS、VLSIJ、电子与信息学报等期刊及会议审稿人。

你知道你的Internet Explorer是过时了吗?

为了得到我们网站最好的体验效果,我们建议您升级到最新版本的Internet Explorer或选择另一个web浏览器.一个列表最流行的web浏览器在下面可以找到.