爱吧机器人网 » 技术 > 智能硬件 > 正文

读心术成现实!麻省理工研发出头戴设备“AlterEgo” 信息识别准确率达92%

核心提示:据外媒报道,近日,美国麻省理工大学(MIT)新开发了一款名为AlterEgo的头戴设备,可以实现不言自明的读心境界。用户不用说话,它就能够识

据外媒报道,近日,美国麻省理工大学(MIT)新开发了一款名为“AlterEgo”的头戴设备,可以实现“不言自明”的读心境界。用户不用说话,它就能够识别出用户想说的内容。而且——识别“沉默语言”信息的准确率高达92%!

\

据称,有了这一神奇的黑科技,人们就可以在某些时候——比如在公共场合选择不发出语音,即可下达指令,从而免去很多尴尬。

这种头戴设备其实是一种计算机界面,由可穿戴设备和相关计算系统组成。设备中的电极会捕捉下颌和面部的神经肌肉信号,这些信号是由内部言语触发的——能够读取你脑海中想说的话——但是人眼无法察觉。信号被馈送到机器学习系统,该机器学习系统已经被训练成将特定信号与特定的字相关联。

该装置还包括一对骨传导头戴式耳机,其通过脸部的骨骼将振动传递到内耳。由于它们不会阻塞耳道,因此耳机可以使系统在不中断对话、不干扰用户的听觉体验的情况下,向用户传达信息。

该设备是一个完整的静音计算系统的一部分,可让用户无法察觉地摆出姿势并接受难以计算问题的答案。例如,在研究人员的一项实验中,受试者使用该系统默默报告对手在国际象棋游戏中的动作,并同样默默接受计算机推荐的回应。

\

“这样做的动机是建立一个智能增强设备,”麻省理工学院媒体实验室的研究生Arnav Kapur说,他领导了这个新系统的开发。“我们的想法是:我们可以拥有一个更内部的计算平台,它在某些方面融合了人机和计算机,并且感觉像是我们自己认知的内部扩展。”

“我们基本上离不开我们的手机和数字设备,”媒体艺术和科学教授Pattie Maes说。 “但目前,这些设备的使用非常具有破坏性。如果我想要查看与我正在进行的对话相关的事情,我必须找到我的手机并键入密码并打开一个应用,并输入一些搜索关键字,整个事情要求我完全将注意力从周围环境以及对话的人转移到手机上。所以,我和我的学生长期以来一直在尝试新的外形因素和新的体验类型,让人们仍然可以从这些设备给我们提供的所有精彩知识和服务中受益,并可以同时更融入自己周围的环境。

微妙的信号

自19世纪以来,内部言语表达与身体相关的观点一直存在,并在20世纪50年代进行了严格的调查。 20世纪60年代速读运动的目标之一就是消除内部的言语表达,或者称之为“默读”(subvocalization)。

但是,作为计算机接口的默读内容很大程度上是未知的。研究人员的第一步是确定脸上哪些位置是最可靠的神经肌肉信号的来源。所以他们进行了一些实验,在这些实验中,要求相同的受试者将同一系列的单词四次次定位,每次16个电极在不同的面部位置。

研究人员编写代码来分析结果数据,发现来自七个特定电极位置的信号始终能够区分次定位字。在会议论文中,研究人员报告了一种可穿戴无声语音界面的原型,该界面像电话耳机一样缠绕在脖子后部,并且具有触手状弯曲的附属物,其在嘴部两侧的七个位置处接触脸部并贴合着下巴。

但是在目前的实验中,研究人员使用一个颚上只有四个电极的方法获得了可比较的结果,可喜的是,佩戴的这个设备不像以往那么笨重累赘。

一旦他们选择了电极位置,研究人员就开始收集数据,内容包括一些有限词汇表的计算任务——每个约20字。一种是算术运算,其中用户将重点定位大的加法或乘法问题;另一个是国际象棋应用程序,用户使用标准的国际象棋编号系统来报告具体的移动。

然后,对于每个应用程序,他们使用神经网络来查找特定神经肌肉信号和特定词之间的相关性。像大多数神经网络一样,研究人员使用的网络被安排成简单处理节点的层次,每个层次都连接到上下层中的几个节点。数据被送入底层,其节点处理它并将它们传递给下一层,节点处理它并将它们传递到下一层,依此类推。最终图层产量的输出是一些分类任务的结果。

研究人员系统的基本配置包括一个神经网络,通过训练来识别来自神经肌肉信号的未定位词语,但它可以通过只重新训练最后两层的过程为特定用户实现定制“识别”。

“无声识别”可靠度有多高?

研究人员利用原型可穿戴接口进行了一项可用性研究,其中10位受试者花费了大约15分钟时间,进行输入,然后用90分钟用于执行计算。在该研究中,该系统的平均转录准确率约为92%。

但是,卡普尔说,系统的性能应该会随着更多的培训数据而改善,这些培训数据可以在日常使用中收集。尽管他并没有揣测数据,但他估计他用于示范的训练有素的系统的准确率高于可用性研究报告的准确率。

在正在进行的工作中,研究人员正在收集大量关于更精细对话的数据,希望能够用更广泛的词汇来构建应用程序。

卡普尔说:“我认为我们有一天会实现全面对话。”

乔治亚理工学院计算学院教授Thad Starner指出,这种“读心系统”在一些特定的操作中将会发挥巨大潜力。比如,在充满噪音的飞机场等环境,地勤和其他工作人员可以更好地传递信号。在一些特别安静的地方它也会大展身手——你不能大声说话时这样的一种设备再方便不过了。另外,一些有发声障碍的残疾人也可以充分应用这一技术带来的便利。

上一篇:AI芯片格局最全分析
下一篇:止不住的炫技,又一次英特尔的人工智能技惊全场

本周栏目热点

止不住的炫技,又一次英特尔的人工智能技惊全场

[2018-04-22]  在今天刚刚圆满落下帷幕的O’Reilly和Intel人工智能大会2018北京站上,众多AI行业领导企业的超级大咖们分享了应用AI的最新创新成果, ...

爱奇艺i71 VR一体机测评 值不值得买 你怎么看?

[2018-04-22]  虽然VR的发展似乎就目前的形式来看有所滞缓,但是在很多科技企业看来,这只是VR发展路上的一些阻碍罢了,并不能影响他们对于VR的热情和执着 ...

听说谷歌弄了个屏幕保护器 再也不用担心别人偷看你手机了

[2018-04-22]  伴随着智能时代的来临,手机的应用也越发的多样化,而对于人们来说,手机是极为私密的东西,里面不仅有大量的私人信息,更有关系着我们经济财产安全的数据。若是一个不小心,......

惠普MR头显测评报告

[2018-04-22]  由微软领头与众多巨头厂商强强联手打造Windows Mixed Reality,强势来袭!!!小编有幸于25号搞到Windows Mixed Reality系列头显--惠普MR ...

VR成人公司公布视频使用数据,大家更爱用GearVR!

[2018-04-22]  VR头盔厂商没告诉我们的头盔销量,VR色情公司倒是给了一份使用数据。最近,一家名为BadoinkVR的VR色情公司发布了一份数据。这份数据显示, ...

精选推荐

揭秘达芬奇手术机器人
揭秘达芬奇手术机器人

[2018-04-19]  达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局(FDA)于2000年通过该标准,旨在利用微创手段 ...

通过对抗性图像黑入大脑
通过对抗性图像黑入大脑

[2018-03-02]  在上面的图片中,左边是一张猫的照片。在右边,你能分辨出它是同一只猫的图片,还是一张看起来相似的狗的图片?这两张图片之间的区别在于, ...

德国研发出一种能在你体内工作的微型机器人

[2018-01-26]  纽约时报的报道,德国的研究人员已经开发出一种长约七分之一英寸的机器人,首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路,跳跃,爬行,滚动和游泳。它甚至爬出......

机器人灵巧手将成为智能机器人的下一个重大突破
机器人灵巧手将成为智能机器人的下一个重大突破

[2018-01-25]  计算机科学教授兼东北地区助手机器人实验室负责人罗伯特·普拉特(Robert Platt)说:“机器人手操作是下一步要解决的问题。想象一下,一个机器人可以在现实世界中用手去做事......

CES 2018:英特尔推出49量子位芯片争夺量子霸权
CES 2018:英特尔推出49量子位芯片争夺量子霸权

[2018-01-10]  在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中,英特尔通过了一个关键的里程碑。近日,这个科技巨头已经推出了一个49个量子位 ...

从AI中窥探人性
从AI中窥探人性

[2018-01-03]  人们对人造智能的恐惧早已成为科幻书籍和电影的极好题材。但现在,一些同样的担忧开始影响关于现实世界AI技术的政策讨论。如果这样的担忧演变成为一种技术恐慌...

2017年:AI渗入云端
2017年:AI渗入云端

[2017-12-29]  云中的人工智能不仅仅是科技巨头的权力游戏,它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

人工智能民主化能否实现取决于科技巨头
人工智能民主化能否实现取决于科技巨头

[2017-12-29]  我们经常听到像谷歌和微软这样的公司说他们希望人工智能民主化。这是一个很好的词,民主化。 但这些公司如何界定“民主化”还不清楚,像AI本身一样,它似乎有点炒作的味道...

美国Natilus公司试飞水上无人货机 设计简单成本降低
美国Natilus公司试飞水上无人货机 设计简单成本降低

[2017-12-28]  Natilus创业公司成立于2014年,其梦想是建造大型无人机,以半价提供比船舶快得多国际货运。在十二月份,Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出
助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出

[2017-12-25]  本文提出了一个大型的、长序列的、用于行人重识别的视频数据集,简称LVreID。与现有的同类数据集相比,该数据集具有以下特点:1)长序列:平均每段视频序列长为200帧,包含丰......