爱吧机器人网 » 技术 > 机器学习 > 正文

不再喂数据 科学家想让机器人自己上网找资料

  这跟以往直接拿数据培训 机器人 不太一样。

  对于机器人来说,像人一样从语句中获取信息是很难的。因而在训练机器人之前,通常会有筛选培训资料的过程,方便机器人在被喂入数据后,比较容易在大量资料中找到模块化的信息。

  这种培训方式,对于计算机技术比较合适,只需要时间累积,但对于人们常用的语言来说,却是个麻烦。

  这跟人们的表达方式有关系。宾夕法尼亚大学计算机和信息科学的助理教授ChrisCallison-Burch称:“自然语言的诸多难点之一在于,你可以用很多不同的方式来表达同样的信息,而抓住所有的这些变化,就是建立一个复杂模型过程中面临的挑战之一。”

  说的直白点,就是人类所用的语言比较复杂,不能直接用作机器人的培训资料。

  但Regina Barzilay等3位麻省理工学院研究人员最近想到了一个新角度,他们想让机器人自己从网上寻找信息,像人一样找更多资料做信息的补充。对于研究来说,这样做的好处最直接的是可以减少前期的人力成本。

\

  简单来说,他们使用了人工智能的一种技术——强化学习,做了两个 应用 场景的测试。其一是在美国枪击案的新闻中找资料,包括枪击地点、伤亡人数;另外一个则是搜集食品造假事件的相似性,包括食品种类、食品造假的类型和地点。

  每个测试都只使用300份新闻。但在测试中,麻省理工学院培训的机器人每分析1篇文章,它都会从网上找9、10篇新闻作为相关资料进行分析,以补充原本资料的不足。其中的困难之处在于,让机器人判断两篇新闻描述了同一件事,并且从多份资料中提取数据。

  论文中举了一个谋杀案的案例,下面是3个新闻中摘出来的片段:

  警官在周一公布称,一对夫妇和四个小孩死在他们位于南达科他州的家里,他们的家发生了火灾,他们显然是死于入室谋杀……一份官方声明称,Scott Westerhuis的死因是“疑似自杀性质的猎枪枪击”。

  官方称,一个南达科他州家庭的6名成员被发现死在了火灾烧毁的家中,他们死于枪击,其中有一例死亡怀疑是自杀。

  AGJackle称,所有的证据都支持他基于9月份的初步发现做的推理:Scott Westerhuis用一把猎枪枪杀了他的妻子和孩子,点燃了他的房子,然后用猎枪自杀。

  最终,他们培训的机器人需要在网上找到类似下面2篇那样的新闻,并且挖出这两个信息:开抢的人是Scott Westerhuis,以及死亡人数是6人。

  在两项测试中,麻省理工学院开发的系统能根据那些与目标信息相关的词汇进行搜索,例如枪击案的凶手通常会跟“警方(police)”、“确认(identified)“、”逮捕(arrested)“等词汇有关系,从而判断具体的人。

  麻省理工学院的研究员称,他们用这种新技术做数据整理,准确率要比以往的筛选方式高出10%。不过,对于普通人来说,这种新技术看起来有趣的一点是,它让机器人的工作方式更接近于人类的思考方式:获取一个信息后,用更多的信息补充它。




上一篇:机器学习与卫星结合 从太空中就能识别贫困地区
下一篇:大规模机器学习:将数据科学引入生产系统架构的典型模式
精选推荐
MIT用深度学习处理3D点云数据 应用于无人汽车等领域
MIT用深度学习处理3D点云数据 应用于无人汽车等领域

[2019-10-23]  如果你见过自动驾驶汽车,也许会对车顶上那个一直在旋转的圆柱体感到好奇。这是一个雷达传感器,无人驾驶汽车依靠它在现实世界中进行导航。 ...

7种常见的机器人焊接类型
7种常见的机器人焊接类型

[2017-12-17]  机器人焊接是工业领域最常见的机器人应用之一,近几十年来主要由汽车行业驱动。机器人焊接在完成大批量,重复性的焊接任务时效率最高。...

2023年服务机器人市场将超过250亿美元
2023年服务机器人市场将超过250亿美元

[2017-09-04]  全球服务机器人市场预计到2023年将达到250亿美元, 并在预测期内登记15% 的复合年增长率。短期中期回收期和投资回报率高 (ROI), 以及在教育和研究、临场感、防御、救援和安......

谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算
谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算

[2019-10-23]  谷歌坚称自己已经取得了量子霸权——这标志着计算研究领域的一个重要里程碑。谷歌首次发布声明是在今年9月,虽然遭到竞争对手的质疑,但就 ...

Crossbar将电阻式RAM推入嵌入式AI
Crossbar将电阻式RAM推入嵌入式AI

[2018-05-17]  电阻RAM技术开发商Crossbar表示,它已与航空航天芯片制造商Microsemi达成协议,允许后者在未来的芯片中嵌入Crossbar的非易失性存储器。此举是在先进制造业节点的领先代工厂选......

深度神经网络揭示了大脑喜欢看什么
深度神经网络揭示了大脑喜欢看什么

[2019-11-06]  爱吧机器人网编者按:近日,《自然-神经科学》发表了一篇论文,研究人员创建了一种深度人工神经网络,能够准确预测生物大脑对视觉刺激所产 ...

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私
英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14]  英伟达(Nvidia)和伦敦国王学院(King’s College London)的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络, ...

人工神经网络技术解码人类行为和想象时的大脑活动信号
人工神经网络技术解码人类行为和想象时的大脑活动信号

[2017-08-23]  为搜索引擎过滤信息,棋盘游戏对弈,识别图像 人工智能在某些任务中远远超过了人类智能。来自弗莱堡由神经科学家私人讲师Tonio Ball博士领导的几个杰出的BrainLinks-Bra......

本周栏目热点

深度学习反向传播算法(BP)原理推导及代码实现

[2017-12-19]  分析了手写字数据集分类的原理,利用神经网络模型,编写了SGD算法的代码,分多个epochs,每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中,非常重要的一个步骤,......

如何在机器学习项目中使用统计方法的示例

[2018-07-23]  事实上,机器学习预测建模项目必须通过统计学方法才能有效的进行。在本文中,我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。...

[2017-08-28]  模拟退火(Simulated Annealing,简称SA)是一种通用概率算法,用来在一个大的搜寻空间内找寻命题的最优解。1、固体退火原理:将固体加温 ...

Machine Learning-感知器分类算法详解

[2018-05-31]  今天我们来讲解的内容是感知器分类算法,本文的结构如下:什么是感知器分类算法,在Python中实现感知器学习算法,在iris(鸢尾花)数据集上训练一个感知器模型,自适应线性神......

机器人是怎么深度学习的?

[2016-03-29]      一个人独处时,感觉有点孤单,怎么办?微软亚洲研究院推出的微软小冰,或许 ...