微软宣布:Skype 和 Powerpoint 幻灯片将有实时字幕

图片来源:视觉中国

自认为英语还可以的小探,最怕和别人说话时,别人说了一句怎么也听不懂的英文。

一般来讲,第一次没听懂,你大可以放心大胆地请人家再说一遍。

第二遍如果还没听懂,小探觉得就有必要加上两句 “不好意思,刚才没听见” 之类的客套话,请人家再重复一遍。

如果第三次还没听懂(而且这时对方的不耐烦一般已经很难掩饰了),小探只好礼貌微笑+说一句 “yeah, right?”,然后默默祈祷人家刚才说的那句话不是一个问题。

这种略尴尬的情形,相信不少人都遇到过。每当这时小探就忍不住想:要是所有人讲的话都能和电影里一样配上字幕就好了!

还别说,很快,微软就会让这个想法变成现实...

Skype 和 Powerpoint 幻灯片将有实时字幕

相信大家对视频聊天软件 Skype 并不陌生。本周微软宣布,以后我们再用 Skype 的时候,就能有实时字幕功能了!

也就是说,不论视频还是语音,你在和对方聊天的时候,不论是对方说的话、还是你说的话,Skype 都能同时把它变成字幕,呈现在屏幕下方 —— 就像我们看电影、看剧底下的那行字一样,只不过它们不是预先写好的台词,而是你在那时那刻说的话。

图自 Microsoft,版权属于原作者

使用 Skype 时,点击 “更多(+)” 按钮,然后选择 “打开字幕”,就可以使用这项功能啦!

图自 Microsoft,版权属于原作者

如果嫌麻烦,也可以直接调成默认有字幕的设置:点击你的头像,进入 “设置” 栏,然后进入 “呼叫”、再点 “呼叫字幕” 的 “显示字幕”,就可以以后每次通话默认显示字幕了。

图自 Microsoft,版权属于原作者

“即时翻译” 这个功能打开后,对方说的话的字幕就会像电影字幕一样自动滚动 —— 但字幕过去了就过去了,目前用户还不能往前翻、查看之前的对话。

不过微软说了,以后还会开发其它让大家看字幕的方式,比如侧窗滚动字幕,这样如果对方刚才说的东西你没听清,还可以往上滑动字幕,找回去。

微软还说,这个新功能不仅能够快速、连续地给对话配上字幕,而且随着对你说的话了解越来越多,AI 自己能通过研究上下文做 “阅读理解”,让自己越来越聪明、把字幕转写得越来越准确。

虽然目前这个新功能只支持英语,但很快 Skype 将支持超过 20 种语言和方言翻译的功能。到时,Skype 不仅有即时字幕,还能用机器做到 “同声传译”。

看到这个新闻,小探的第一反应是:爽!再也不怕对方说话不清楚、口音重之类的问题,简直是居家旅行、学习外语、跨国交友的必备良品。

不过,微软发布这个新功能的本意,其实是想帮助耳聋或听障人士,让他们可以在用 Skype 时,通过阅读实时翻译的对方说的话,来参与到对话里。

这就是为什么微软特意选择在本周一发布这个新功能:12 月 3 号是联合国国际残疾人日。微软选择在这一天给 Skype 加上实时字幕,就是希望通过这个小功能,让听障人士的生活简单一点点。

除了 Skype,微软还计划把我们最熟悉不过的 “PPT” PowerPoint,也加上实时字幕。不仅如此,PowerPoint 也会有即时翻译功能,甚至还能把字幕发到听众的手机上。

想象一下:假设一个有口音的人在以英文演讲,但你听不太懂,因为他的口音实在是太严重了(比如俄罗斯、新加坡或巴西口音)。这时,你可以看大屏幕上的英文字幕,或者也可以让 PowerPoint 直接把英文翻译成中文,发到你的手机或电脑上。

哪里听不懂点哪里,妈妈再也不怕我视频开会时听不懂印度老板的话了。

听着不错吧?不过微软说,这个功能正式发布,还需要等到明年年初。PowerPoint 将提供 12 种语言的实时字幕,还能把原语言翻译成 60 多种语言。

小探认为,PowerPoint 背后 AI 的语音识别技术,有个其他语音识别技术没有的优势:它不仅需要分辨出你说的话,还需要把你说的话,与幻灯片上的词汇联系起来,这样可以更准确地识别演讲中提到的专有名称和特定术语。

和 PowerPoint 颇为相似的 Google Slides 也推出了同样的功能,但相比之下,PowerPoint 的功能更全面些:

Google slides 的实时字幕功能 / 版权属于 Google

不论 PowerPoint 还是 Skype,微软给这两个产品新添加的功能,都是用 AI 把正在发生的谈话实时以文本的形式呈现出来,让 AI 变成我们的速记员和同声传译。

除了方便不同语言的人之间的交流,微软此举更是意在帮助听障人士。而微软对残疾人群体的关注,早已不是一两天。

微软:用 AI 改善残疾人的生活

全球残疾人人数超过 10 亿,很多时候,这个群体并不能像其他人一样享受科技带来的便利 —— 在这 10 亿人中,只有约 10% 的残疾人用得上辅助工具(比如助听设备、义肢等)。

残疾会让找工作变得格外艰难。根据美国人口普查局的统计,在失聪及听障人群里,只有 52% 的人有工作。无法保证工作,自然会导致生活水平下降,对残疾人来说,无疑雪上加霜。

一直以来,微软就想通过 AI 让残疾人能更好地参与到工作环境里,而 PowerPoint 和 Skype 的实时字幕只是微软诸多动作中的一两种。要知道,在过去三年里,微软给 Office 365 的各个产品陆陆续续加了 30 多个方便残疾人用户的功能。

而帮助残疾人更适应工作场所,其实只是微软 “用 AI 改善残疾人生活质量” 这个宏大计划下的一小部分。

今年 5 月 7 号,微软在其名为 “Build” 的年度开发者大会上宣布,将开展一个名为 “AI for Accessibility”(“用人工智能,让生活无障碍”)的人工智能项目。

微软计划在未来五年里,专门拿出 2500 万美元,帮助那些能改善残疾人生活、工作、和与人交流相关的 AI 产品的开发。微软认为,语言不通、或者有某种身体残疾,都不应该成为交流的障碍。微软之所以如此关注这一领域,不知道和微软 CEO 的儿子身患残疾是否有关。

这个计划将通过三种方式来实现这一点。

首先,微软将大学、科研机构、开发者,任何提出帮助残疾人生活更便利的 AI 解决方案的团队提供种子技术授权,优先使用 AI 方法,帮助更多残疾人士找到工作、降低生活里的不便(比如我们上文提到的无法用 Skype、无法听别人的演讲)。

然后,微软从这些项目里选出最有可能成功的项目,进行更大规模的技术投资,同时微软也会带着自己的资源,比如让微软的 AI 专家、合作伙伴参与进来。

接下来,在服务中注入人工智能和包容性设计时,微软也会将这些 AI 创新融入到平台级的服务中,让尽可能多的人能够从中获益。

其实,微软在残疾人工具研发这件事情上,一直就没少花心思。微软在这方面比较有名的一个产品叫 Seeing AI —— 这也是微软十多年计算机视觉的研究成果。

Seeing AI 是微软 2017 年推出的一款 “利用电脑视觉,给盲人描述、解释世界长什么样” 的应用,微软自己管这个应用叫 “为盲人群体服务的有声相机”(Talking camera for the Blind)。这款应用已经在苹果商店获得了超过四星的评分,颇受好评。可惜的是,Seeing AI 目前还只支持英文版。

比如说,视障人士打开这款应用,对着信封,Seeing AI 就能把信封上的信息读出来:

再比如说,Seeing AI 可以告诉用户它都看到了什么。 如下图所示,它看到了 “一把黑色的吉他”,和 “一只手拿着一块表”。

哦对了,小探在写这篇文章查资料时看到,有视障用户在用了 Seeing AI 的产品后,可以帮年幼的孩子检查作业了。

微软高级产品营销经理 Malavika Rewari 接受外媒采访时表示,微软的 “无障碍小组” 里,约 90% 的员工都有某种残疾。

Ann 是微软 Seeing AI 应用研发小组的一名成员,同时也是一名盲人。

而他们为残疾人开发出来的像 Seeing AI 之类的产品,无疑使残疾人离独立、便利、更有尊严的生活又近了一步。

用科技改善残疾人的生活

在提高残疾人的生活质量这件事上,微软不是唯一一家。

民宿巨头 Airbnb 就是其中之一。以前,用户在 Airbnb 平台搜索房屋时,除了 “价格”、“位置” 等搜索条件,在 “无障碍” 这块,只有 “方便轮椅进出” 这一个相对比较粗糙的选项。

今年三月,Airbnb 新添加了 21 个更细致的 “无障碍” 筛选条件,比如 “是否有无障碍停车位”、“无障碍淋浴” 等条件,让轮椅使用者出行更方便。

谷歌地图相信大家也不陌生。今年,谷歌给用户在选择路线的时候,新添加了 “轮椅可行” 的选项。这样,轮椅使用者就可以避开没有轮椅配套设施的地方。目前只有纽约、伦敦、东京、波士顿、墨西哥城和悉尼的谷歌地图配备了这个新功能,不过谷歌计划把它推广到更多城市。

当然,不论是 Seeing AI 还是谷歌的地图,在用户体验上还有很多需要改善的地方,但这种趋势让人感到非常欣慰。

小探以前有种 “发达国家的残疾人更多” 的错觉,因为在街上总能看到残疾人。相比之下,国内街上残疾人出现的比率似乎低了不少。其实,这不是因为中国的残疾人人口比例更低 —— 据统计,2017年中国各类残疾人总数为8500万人,也有统计认为人数接近一亿,是世界上残疾人口最多的国家。之所以大街小巷上不怎么看得到残疾人,是因为我们的无障碍设施还做得很不到位。

不论出于温情,还是庞大的残疾人群体背后的巨大市场,硅谷的巨头们纷纷开始关注无障碍领域里的机会。希望不远的将来,这类新技术能帮助残疾人们获得更便利的生活。

推荐DIY文章
华为CFO孟晚舟被捕 美国“长臂管辖”的“臂”有多长
Facebook现故障 小扎主页帖子全部遗失
凯迪拉克XT4新上市两款车型:分别为28T两驱领先型和28T两驱领先运动型
Onleaks表示三星Galaxy S10 Plus后置四颗摄像头而不是三颗
官方终于大方确认此次的主角:就是传言已久的一加6T迈凯伦定制版
苹果获批一项专利,其中提到了可左右耳互换的耳机技术