您的位置:首页 >财经 > 要闻 >

这就是AI公司必须收听您的录音的原因

2020-02-11 19:57:50 [来源]:

8月下旬,Motherboard爆料说微软已经与承包商共享Xbox用户的录音,以改善其AI语音助手的功能。该月初,另一份报告显示,微软正在与承包商共享Skype录音和Cortana语音命令,以改善聊天平台的服务。一些录音包含私密的内容。

微软只是雇用人工来收听和注释用户生成数据的几家公司之一。近几个月来,谷歌,亚马逊,Facebook和苹果公司已经建立了类似的程序,这些程序已经确立了用户隐私保护的倡导者地位。

随着语音助手和聊天机器人的日益普及,科技公司面临着艰巨的挑战:他们的AI算法无法处理人类语言的复杂性,并且他们常常无法理解用户命令和句子的含义。说。

目前,唯一的解决方案是雇用人员以正确的方向引导这些AI算法。这通常需要让那些工作人员听取用户的亲密对话,以便对他们进行转录和注释。

语言理解的挑战

Alexa,Siri和Cortana之类的基于语音的助手的能力归功于深度学习的进步,而深度学习是人工智能的一个分支,在过去几年中非常流行。深度学习算法尤其擅长查找模式和分类信息。

当您提供具有数百万个语音记录及其对应文本的深度学习算法时,它可以非常高精度地转录新的音频摘录。深度学习还擅长预测:当您在大量文本集上训练AI算法时,它会开发出不同单词序列的复杂数学表示形式,并且可以执行诸如自动完成句子之类的任务。

好吧,也许不是。但是Facebook希望AI可以释放您的纳粹新闻,机器人和虚假新闻。对

但是深度学习要努力理解单词和句子的含义,这是纯粹的数学和统计学无法完成的任务。

Robust.AI的认知科学家,认知科学家Gary Marcus说:“语音识别和自然语言理解可能听起来像是类似的问题,但实际上却完全不同。”“在语音识别中,您的语言中的音节和音素数量有限,并且您正在尝试将音频流转换为属于很小类别的内容。”

英语具有成千上万个常用词,在大数据时代,您可以轻松地找到数百万个示例,每个示例都可以用来训练深度学习模型。但是解析句子并解释其含义是完全不同的努力。有无数可能的句子,每个句子都有其独特的含义。单词的含义会根据它们在句子中的位置以及其前后的位置而有所不同。

“除了几个小句子,几乎您听到的每个句子都是原创的。您没有直接获得任何数据。这意味着您在推理和理解上存在问题,” Marcus说。“对于将事物进行分类,将其放入您已经知道的垃圾箱中的技术而言,根本不适合这样做。理解语言是将您已经了解的世界与其他人正在尝试使用的单词联系起来他们说。”

在他的新书《重新引导AI》(与纽约大学教授欧内斯特·戴维斯合着)中,马库斯解释了当代AI在解释人类语言含义时所面临的一些挑战。我们理所当然的事情之一是我们每个人都拥有的世界常识以及我们如何利用这些知识来消除口语和书面语言的歧义。

每天的谈话都充满了这种含糊。例如,考虑一下这句话,马库斯(Marcus)和戴维斯(Davis)在他们的书中对此进行了检查:“艾尔西(Elsie)试图通过电话联系她的姨妈,但她没有回答。”这是一个简单的句子。但是,它还包含您作为人类可以轻松解决的多个歧义。听到句子后,您将立即知道“到达”是指“交流”而不是“实际伸出手”,“在电话上”是指“通过使用电话”而不是“在电话上”和“她” ”是指Elsie的姨妈,而不是Elsie自己。这些都是您无需再三思而行的推断,因为您知道电话的用途,用途以及拨打电话的过程。

无休止的训练周期

深度学习缺乏常识和对世界的了解,这使科技公司别无选择,只能继续通过越来越多的例子来训练他们的AI模型,希望他们最终能够涵盖所有可能的方式来表达AI助手应该做的事情。这就是为什么他们需要人工的帮助,他们通常是远程的且薪水低廉,他们可以评估AI算法的性能,或者转录和注释AI算法无法解密的用户录音。