读心术成现实！麻省理工研发出头戴设备“AlterEgo” 信息识别准确率达92%-智能硬件-技术-爱吧机器人网

读心术成现实！麻省理工研发出头戴设备“AlterEgo” 信息识别准确率达92%

2018-04-09 前瞻网浏览量：

据外媒报道，近日，美国麻省理工大学（MIT）新开发了一款名为“AlterEgo”的头戴设备，可以实现“不言自明”的读心境界。用户不用说话，它就能够识别出用户想说的内容。而且——识别“沉默语言”信息的准确率高达92%！

据称，有了这一神奇的黑科技，人们就可以在某些时候——比如在公共场合选择不发出语音，即可下达指令，从而免去很多尴尬。

这种头戴设备其实是一种计算机界面，由可穿戴设备和相关计算系统组成。设备中的电极会捕捉下颌和面部的神经肌肉信号，这些信号是由内部言语触发的——能够读取你脑海中想说的话——但是人眼无法察觉。信号被馈送到机器学习系统，该机器学习系统已经被训练成将特定信号与特定的字相关联。

该装置还包括一对骨传导头戴式耳机，其通过脸部的骨骼将振动传递到内耳。由于它们不会阻塞耳道，因此耳机可以使系统在不中断对话、不干扰用户的听觉体验的情况下，向用户传达信息。

该设备是一个完整的静音计算系统的一部分，可让用户无法察觉地摆出姿势并接受难以计算问题的答案。例如，在研究人员的一项实验中，受试者使用该系统默默报告对手在国际象棋游戏中的动作，并同样默默接受计算机推荐的回应。

“这样做的动机是建立一个智能增强设备，”麻省理工学院媒体实验室的研究生Arnav Kapur说，他领导了这个新系统的开发。“我们的想法是：我们可以拥有一个更内部的计算平台，它在某些方面融合了人机和计算机，并且感觉像是我们自己认知的内部扩展。”

“我们基本上离不开我们的手机和数字设备，”媒体艺术和科学教授Pattie Maes说。 “但目前，这些设备的使用非常具有破坏性。如果我想要查看与我正在进行的对话相关的事情，我必须找到我的手机并键入密码并打开一个应用，并输入一些搜索关键字，整个事情要求我完全将注意力从周围环境以及对话的人转移到手机上。所以，我和我的学生长期以来一直在尝试新的外形因素和新的体验类型，让人们仍然可以从这些设备给我们提供的所有精彩知识和服务中受益，并可以同时更融入自己周围的环境。

微妙的信号

自19世纪以来，内部言语表达与身体相关的观点一直存在，并在20世纪50年代进行了严格的调查。 20世纪60年代速读运动的目标之一就是消除内部的言语表达，或者称之为“默读”（subvocalization）。

但是，作为计算机接口的默读内容很大程度上是未知的。研究人员的第一步是确定脸上哪些位置是最可靠的神经肌肉信号的来源。所以他们进行了一些实验，在这些实验中，要求相同的受试者将同一系列的单词四次次定位，每次16个电极在不同的面部位置。

研究人员编写代码来分析结果数据，发现来自七个特定电极位置的信号始终能够区分次定位字。在会议论文中，研究人员报告了一种可穿戴无声语音界面的原型，该界面像电话耳机一样缠绕在脖子后部，并且具有触手状弯曲的附属物，其在嘴部两侧的七个位置处接触脸部并贴合着下巴。

但是在目前的实验中，研究人员使用一个颚上只有四个电极的方法获得了可比较的结果，可喜的是，佩戴的这个设备不像以往那么笨重累赘。

一旦他们选择了电极位置，研究人员就开始收集数据，内容包括一些有限词汇表的计算任务——每个约20字。一种是算术运算，其中用户将重点定位大的加法或乘法问题；另一个是国际象棋应用程序，用户使用标准的国际象棋编号系统来报告具体的移动。

然后，对于每个应用程序，他们使用神经网络来查找特定神经肌肉信号和特定词之间的相关性。像大多数神经网络一样，研究人员使用的网络被安排成简单处理节点的层次，每个层次都连接到上下层中的几个节点。数据被送入底层，其节点处理它并将它们传递给下一层，节点处理它并将它们传递到下一层，依此类推。最终图层产量的输出是一些分类任务的结果。

研究人员系统的基本配置包括一个神经网络，通过训练来识别来自神经肌肉信号的未定位词语，但它可以通过只重新训练最后两层的过程为特定用户实现定制“识别”。

“无声识别”可靠度有多高？

研究人员利用原型可穿戴接口进行了一项可用性研究，其中10位受试者花费了大约15分钟时间，进行输入，然后用90分钟用于执行计算。在该研究中，该系统的平均转录准确率约为92％。

但是，卡普尔说，系统的性能应该会随着更多的培训数据而改善，这些培训数据可以在日常使用中收集。尽管他并没有揣测数据，但他估计他用于示范的训练有素的系统的准确率高于可用性研究报告的准确率。

在正在进行的工作中，研究人员正在收集大量关于更精细对话的数据，希望能够用更广泛的词汇来构建应用程序。

卡普尔说：“我认为我们有一天会实现全面对话。”

乔治亚理工学院计算学院教授Thad Starner指出，这种“读心系统”在一些特定的操作中将会发挥巨大潜力。比如，在充满噪音的飞机场等环境，地勤和其他工作人员可以更好地传递信号。在一些特别安静的地方它也会大展身手——你不能大声说话时这样的一种设备再方便不过了。另外，一些有发声障碍的残疾人也可以充分应用这一技术带来的便利。

精选推荐

人工智能准确预测患者一年内的死亡风险，原理却无法解释

[2019-11-13] 图片来自BURGER PHANIE SCIENCE PHOTO LIBRARY美国最新研究显示，人工智能通过查看心脏测试结果，以高达85%以上的准确率预测了一个人在一 ...

谷歌在中国成立一个新的人工智能（AI）研究中心

[2017-12-13] 谷歌正在中国建立一个新的人工智能（AI）研究中心，希望进一步扩展到中国，以充分利用中国高度重视的人工智能技术。人工智能是目前地球上最具竞争力的领域之一，亚马逊，微软......

农业将为高科技行业农业机器人的应用领域

[2017-12-17] 农业正在迅速成为一个令人兴奋的高科技产业，吸引了新专业人士，新公司和新投资者。技术发展迅速，不仅提高了农民的生产能力，而且促进了我们所知道的机器人和自动化技术的发展。...

谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算

[2019-10-23] 谷歌坚称自己已经取得了量子霸权——这标志着计算研究领域的一个重要里程碑。谷歌首次发布声明是在今年9月，虽然遭到竞争对手的质疑，但就 ...

智能机器人困惑的时候知道该问什么问题

[2017-03-20] 照片：Nick Dentamaro 布朗大学上周，我们提到了麻省理工学院的一些研究，即通过链接人的大脑来帮助机器人在他们将要犯错误的时 ...

什么是机器人学？机器人学简介

[2017-12-14] 机器人学是工程学与科学的交叉学科，包括机械工程，电气工程，计算机科学等。机器人技术涉及机器人的设计、制造、操作和应用，以及用于控制、感官反馈和信息处理的计算机系统。...

2017年：AI渗入云端

[2017-12-29] 云中的人工智能不仅仅是科技巨头的权力游戏，它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

谷歌大脑发布ROBEL基准鼓励用低成本机器人训练AI系统

[2019-10-11] 训练AI系统的机器人D& 39;Claw和D& 39;Kitty用于控制机器人的人工智能系统，测量其性能所使用的基准通常仅限于为工业环境设计的昂贵硬件， ...

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系[email protected]，我们会立即处理。谢谢配合！

本周栏目热点

同步发布人工智能芯片华为苹果竞相角逐人工智能市场

[2017-10-11] 越来越多的企业认为，在移动互联网高度发达的今天，人工智能或将成为下一个转型的拐点，未来十年，科技领域的研发或将全部集中在这个领域之 ...

人工智能成手机发展“新引擎” 用户偏爱“视觉体验”

[2018-12-22] 数据显示，中国手机用户下次更换手机时，95 9%的人会选择购买AI手机。现有人工智能手机用户渗透率高，潜在用户广泛存在，消费者整体认为人脸解锁和语音助手体验最好。...

传苹果明年3月举行Watch 2和4吋屏iPhone发布会

[1970-01-01] 12月9日消息，据国外媒体9to5Mac报道，苹果的发布会时间一向很有规律，所以现在起预计该公司会在明年3 ...

乐视智能生态是笑话还是神话？

[2015-12-22] 摘要虽然从视频、体育、终端再到金融和O2O，乐视了做了很多，但在崇尚务实文化的社会，乐视高调作风自 ...

摩托罗拉推出360运动手表售价299美元

[2016-01-11] 科技讯1月8日消息，据EngadgetUK网站报道，如果你想要在一款智能手表里体验完整的安卓穿戴体验，那么正 ...