【资料图】
微软研究院近日公开了其最新研究项目——Project Rumi。该项目旨在通过结合文本、音频和视频数据,运用多模态方法,提升人工智能系统的理解能力,使其更能理解人类的意图。 近年来,人工智能系统在自然语言处理(NLP)领域取得了显著的进步。然而,现有的NLP AI主要依赖于文本输入输出,忽略了人类在自然交流中的语调、面部表情、手势和肢体语言等线索,这在一定程度上导致了其在理解方面的偏差。在AI专业术语中,这些线索被统称为副语言。 为了解决这个问题,微软研究院开发了Project Rumi。这是一个新颖的框架,旨在通过多模态副语言提示来增强人工智能的理解。该项目包括两个主要部分:多模式副语言编码器和多模式副语言解码器。
世界热资讯!仅189元!小米智能多模网关2 8.16众筹
【世界热闻】为防止黄牛 日本索尼经销商规定 PS4 老用户才能买 PS5
环球速讯:20年内建成一座自给自足城市 马斯克重申殖民火星想法
天天速看:仅推数字版 任天堂宣布《卡比的美食节》8月17日发售
滚动:得力推出国产自主研发彩色打印机 首发仅售 1299 元
全球滚动:设立54个推荐上车点 “萝卜快跑”合肥开启商业化试点
观察:小米推新品电动牙刷,比普通牙刷还耐用?
世界百事通!CITE2022明日开展:智电生活成热点
热门:再也不怕找耳机了 AirPods Pro 2耳机盒能够发声
环球热点!不管你是否愿意 苹果iPhone广告将越来越多