学术论坛
具身智能感知交互论坛
论坛简介
继大模型后,“具身智能”成为今年科技界的新热点,被认为是新一波人工智能(AI)浪潮中的重点方向。具身智能从视觉、听觉到触觉等扩展了感知维度,将拥有更自主、更丰富的交互能力,除了与人类进行问答交互外,具身交互还涉及根据人类指令执行操作,如抓取和放置物体完成机器人、人类和物体之间的交互,这需要全面的语义理解、场景感知、决策制定和稳健的控制规划。具身智能人机交互论坛将对具身交互中的感知、决策、执行、评估以及安全等多个方面进行研讨,构建具身交互的技术体系,形成具身交互新范式,为具身智能的人机交互健康快速发展提供一个交流平台。
论坛日程
论坛时间:2025年5月10日15:50-17:50
论坛名称:具身智能感知交互论坛
主持人:田丰,张卫东
论坛主席
  • 田丰-软件所.jpg

    田丰
    中国科学院软件研究所研究员
    个人简介: 中国科学院软件研究所二级研究员、国家科技进步二等奖第一完成人,国家“万人计划”科技创新领军人才,享受国务院政府特殊津贴专家,新一代人工智能国家科技重大专项重大项目、国家重点研发计划项目首席科学家,国家优秀青年基金获得者,科技部创新人才推进计划”中青年科技创新领军人才。担任ACM SIGCHI中国分会主席(2011-2019)、中国计算机学会人机交互专委会主任等职。担任多个人机交互领域著名国际刊物编委、著名学术会议程序委员会委员。在国内外重要期刊会议上发表学术论文百余篇,合作出版专著2部、译著1部。技术成果已覆盖到国内30多个省市以及北美、欧洲、亚洲、非洲等多个国家。作为第一完成人获得了2018年度国家科技进步二等奖、2015年度北京市科学技术一等奖。

  • 张卫动-上海交通大学.jpg

    张卫东
    上海交通大学 教授
    个人简介: 张卫东,男,1967年生。教授、博导、国家级高层次人才、享受国务院政府特殊津贴专家、德国洪堡学者、海南省高层次人才(B)、上海市优秀学科带头人、江苏省双创人才、爱思维尔高被引学者、入选全球前0.05%顶尖科学家终身榜单。发表SCI论文200多篇,出版英文专著2部,获得国家发明专利授权52项。现任上海高校船舶自动化工程研究中心主任。
论坛讲者信息

  • 王党校-北京航空航天大学.jpg

    王党校
    北京航空航天大学 教授
    报告题目: 泛在触觉的愿景和实践
    报告摘要: 触觉是人类感知周围世界和执行精细运动和灵巧操作的基础。在人与物理世界的交互中,触觉通道时时刻刻发挥着重要作用。随着人机物融合时代的来临,数字世界和物理世界呈现出深度融合的蓬勃发展态势。本报告将提出“泛在触觉”的愿景,探索如何通过人类的触觉通道,创造人-机-物理环境-数字环境的触觉交互新范式,实现物质-信息-能量的深度融合,并结合机器触觉领域过去30年的发展历史,探讨实现“泛在触觉”面临的技术挑战和可能的解决方案。
    个人简介: 王党校,北京航空航天大学教授,博士生导师。虚拟现实技术与系统全国重点实验室副主任。北京航空航天大学机器人研究所副所长。美国斯坦福大学、瑞典卡洛琳斯卡医学院、美国北卡罗来纳大学访问学者。研究领域机器触觉、认知触觉、脑机交互、医用机器人。第一和通讯作者发表IEEE Transactions 论文30余篇,出版Springer英文专著1部。负责国家重点研发计划项目、国家科技支撑计划项目、国家自然科学基金项目等10余项。获教育部技术发明一等奖1项,中国电子学会科技进步奖一等奖1项。 机器人和自动化领域顶级国际会议IEEE International Conference on Robotics and Automation (IEEE ICRA 2011)最佳论文提名、触觉领域知名会议(EuroHaptics 2016)最佳论文提名、全国人机交互学术会议(CHCI2020)最佳论文奖、触觉领域顶级会议(IEEE World Haptics Conference 2023)最佳论文提名。亚洲触觉会议(AsiaHaptics 2022)主席(General Chair)。曾任国际电气和电子工程师协会(IEEE)触觉技术委员会主席,IEEE Transactions on Haptics编委(Associate Editor),IEEE Transactions on Industrial Electronics客座编委(Guest Editor)。中国仪器仪表学会力触觉感知与交互专业委员会副主任,中国计算机学会人机交互专业委员会副主任。IEEE高级会员,中国计算机学会杰出会员,中国机械工程学会高级会员。

  • 蒋树强-计算所.jpg

    蒋树强
    中国科学院计算技术研究所 研究员
    报告题目: 基于具身记忆的视觉导航
    报告摘要: 具身导航是指智能体根据任务目标(如语言指令)感知与理解周围环境,预测并执行移动动作,是具身智能系统与真实世界交互的关键技术之一。生理学与认知科学研究表明,记忆在导航任务中起着至关重要的作用,智能体不仅通过当前观察来感知环境,还能通过过往经验和记忆对未观测的环境进行推测。通过引入具身记忆,智能体能够借助物理具身化提供的记忆功能,预想并推测未观测环境状态,从而在更长远的时间尺度上进行导航决策。因此,如何将具身记忆与导航任务相结合,为智能体提供丰富的预想与决策能力,是一项值得研究的重要问题。本报告将首先介绍具身智能、具身记忆与具身导航的研究背景,并汇报多项基于具身记忆的视觉导航研究进展。
    个人简介: 蒋树强,中国科学院计算技术研究所研究员,博士生导师,先后担任期刊《IEEE TMM》、《ACM ToMM》、《IEEE Multimedia》、《计算机研究与发展》、《JCST》、《CAD学报》编委,中国计算机学会多媒体专委会副主任、中国人工智能学会智能服务专委会副主任、中国自动化学会网络计算专委会副主任、ACM SIGMM中国分会副主席。主要研究方向是多媒体内容分析、多模态具身智能技术和食品计算。主持承担科技创新2030-“新一代人工智能”重大项目、国家自然科学基金青年基金A类(杰青)、B类(优青)、重点等项目20余项,发表论文200余篇,获授权专利20余项,多项技术应用到实际系统中,先后获省部级或学会奖励5项。

  • 钱彦旻-上海交通大学.jpg
    钱彦旻
    上海交通大学 教授
    报告题目: 听觉人工智能进展及应用
    报告摘要:
    个人简介: 钱彦旻:上海交通大学计算机科学与工程系特聘教授,博士生导师。清华大学博士,英国剑桥大学工程系博士后。教育部长江学者,国家优秀青年基金、吴文俊人工智能自然科学奖一等奖(第一完成人)获得者。现为IEEE高级会员、ISCA会员,同时也是国际开源项目Kaldi语音识别工具包的13位创始成员之一。担任InterSpeech, ISCSLP等国际会议的领域主席和TPC委员;IEEE T-ASLP, IEEE J-STSP, IEEE SPL, ICASSP, InterSpeech等期刊和国际会议审稿人。有10余年从事智能语音及语言处理、人机交互、模式识别及机器学习的研究和产业化工作经验。在本领域的一流国际期刊和会议上发表学术论文近300篇,Google Scholar引用总数16000余次,申请100余项中美专利,合作撰写和翻译多本外文书籍。4次获得领域内国际权威期刊和会议的最优论文奖,6次带队获得国际评测冠军。作为负责人和主要参与者参加了包括国家自然科学基金、国家脑科学计划、国家重点研发计划、国防JKW、国家863、英国EPSRC等多个项目。目前的研究领域包括:语音识别和语音翻译,说话人和语种识别,语音抗噪与分离,音乐生成和理解,语音情感感知,多模态和跨模态信息处理,自然语言理解,深度学习建模,多媒体信号处理等。

  • 印二威-国防科技创新研究院.jpg
    印二威
    国防科技创新研究院 研究员
    报告题目: 智能人机交互技术
    报告摘要: 系统阐述智能人机交互技术的概念内涵、发展历程和发展趋势;重点介绍团队围绕智能人机交互基础理论、关键技术和系统研发等方面取得的研究进展;简要展望装备领域智能人机交互技术的未来发展方向。
    个人简介: 印二威,国防科技创新研究院人机共融技术研究室主任,天津(滨海)人工智能创新中心副主任,研究员,博导,国家级高层次人才,学科拔尖人才,长期从事智能人机交互技术研究。担任某部委预研专项技术总师,主持国家自然科学基金重点项目等20余项;发表学术论文140余篇,出版著作6部,主编丛书1套,被评为中国指挥与控制学会青年科学家、中国电子学会优秀科技工作者、微软学术评为脑机接口专业领域全球TOP100最有影响力学者、首届华瑙杰出青年奖等荣誉,中国自动化学会优博,授权发明专利100余项,获得吴文俊人工智能自然科学一等奖、中国专利优秀奖、日内瓦国际发明展金奖(IFIA专项奖)、全国发明展览会发明创业奖金奖、金桥奖突出贡献奖、首届“创新杯”国防科技创新大赛一等奖、世界机器人大赛特等奖等。担任中国电子学会智能人机交互专委会副主任委员(学会青年科学家俱乐部成员)、中国指挥与控制学会虚拟现实与人机交互副主任委员、中国认知学会认知建模专委会副秘书长,北京大学、哈工大、上海交大、同济大学、中山大学、天津大学、吉林大学、上海大学等高校兼职博导。

  • 刘若楠-上海交通大学.jpg
    刘若楠
    上海交通大学 副教授
    报告题目: 具身智能交互感知与导航
    报告摘要: 视觉语言导航(Vision-and-Language Navigation, VLN)是一种结合视觉感知和自然语言理解的技术,能够让智能体(如机器人或虚拟助手)根据自然语言指令在真实或虚拟环境中进行导航。本报告针对视觉语言导航(VLN)领域视觉信息捕捉不足、空间关系缺失和跨模态融合困难等挑战,从多视觉特征、鸟瞰图3D场景建模、视觉指令对齐,零样本导航等方面提出一系列视觉语言导航创新方法,显著提升了智能体在复杂环境中的自主导航能力,相关成果发表于NeurIPS、IJCAI、ICRA、IROS等计算机或机器人顶会。
    个人简介: 刘若楠,上海交通大学长聘教轨副教授,德国洪堡学者、国家青年托举人才,美国卡耐基梅隆大学计算机科学学院博士后。主要研究方向是具身智能交互感知与导航控制,相关成果以第一或通讯作者发表于IEEE TIP、TNNLS、TFS和TII等计算机一区期刊和NeurIPS、IJCAI、ICRA、IROS等计算机或机器人顶会,其中8篇入选ESI高被引,2篇热点论文。获IEEE TII(IF 11.7)2021年度最佳论文奖,CCF-A会IJCAI 2024 Runner-up Paper Award,CAA-A会IEEE ARM 2024最佳论文奖提名等论文奖项。担任CAA-A会IEEE INDIN 2025大会出版主席,研究工作曾被IEEE News首页报道,连续5年入选斯坦福“全球前2%顶尖科学家”榜单。
论坛联系人
  • 温正棋
    清华大学
    zqwen@tsinghua.edu.cn
参会注册

你知道你的Internet Explorer是过时了吗?

为了得到我们网站最好的体验效果,我们建议您升级到最新版本的Internet Explorer或选择另一个web浏览器.一个列表最流行的web浏览器在下面可以找到.