机器学习与语义搜索谷歌的终极武器是什么？-机器学习-技术-爱吧机器人网

机器学习与语义搜索谷歌的终极武器是什么？

2017-02-10 爱吧机器人网浏览量：

机器学习与语义搜索谷歌的终极武器是什么？

文/机器之心

过去这几年对于搜索引擎营销者来说是激动人心的（或者说有些骇人，如果你不那么能够接受变化的话）。谷歌引入了一系列新技术和系统来优化其已非常出色的搜索算法，它的竞争者如必应，苹果，微软，甚至是Facebook也引进或升级了对应的系统来优化它们的用户搜索体验。

而这些优化的核心目标则是解决计算机与人工智能历史上最困难的问题之一：对自然语言的获取与理解。虽然机器非常擅长程序性和逻辑性的任务（如解数学方程或识别物体数据特征），但是它们难以辨析那些仅有母语使用者才能凭直觉感受到的微妙差异。举个例子，对我们来说「最近的汉堡店在哪里」和「我想吃汉堡」两句话传达了相似的意图，但是对于基本的机器而言，两者差距甚大：第一句话是对特定信息的检索，与说话者的想法无关；第二句话传达了一个明确的欲望，与信息索取无关。过去几年中，谷歌致力于打破不同语言间的隔阂并且解决其机器算法所面临的问题。但是这一努力的终极目标是什么呢：谷歌是否想要完全地理解人类思维所传达的意图和微妙语义呢？或者说这只是其技术发展中的一次探索？

机器学习与语义搜索谷歌的终极武器是什么？

语义搜索的根源和蜂鸟算法

2013年，伴随着蜂鸟更新（Hummingbird update）的引入，语义搜索（Semantic Search）这一概念第一次进入人们的视野。此前，谷歌通过确定搜索查询语句的关键词来检索出相应的网页。就上述汉堡店的例子来说，谷歌会得到「汉堡」这个关键词，并返回频繁提到该关键词的网页——但这一方法不能真正捕捉用户的意图，它无法区分用户是想搜索「汉堡店」还是「如何自制汉堡」。尽管还需完善，基于用户意图辨析的蜂鸟算法（Hummingbird）能够捕捉到用户意图的关键因素并且「理解」页面的内容，而不再拘泥于页面所包含的关键词。

个人数字助理和语音搜索

个人数字助理，包括谷歌Now和Siri等，需要更高水准的语义理解。目前出现了一些新的障碍，包括将口头语句翻译成输入文本，找到合适的搜索方式，并且以一种可理解的方式进行回复。尽管在本质上，搜索结果的获取依然还是依靠谷歌的标准搜索算法，但人工智能算法不断改进，这些技术已经进步到了我们今天所能看到的水平。首要的动机是让搜索变得更易用，但第二个动机却是要改变用户习惯：语音搜索需要使用对话输入和上下文提示，比起传统的基于关键词的输入，这需要更加强大、更相关的结果。

RankBrain的出现

去年语义领域最大的新闻是RankBrain的出现，它是一种与蜂鸟算法相结合的机器学习算法。我概括了它的目的来对其进行简要说明：

它的作用是帮助谷歌理解用户输入的各种冗长复杂或者模棱两可的口头的查询语句。可以这样理解，它把那些不符合语法规则的糟糕输入语句翻译成可以被算法逻辑解读的形式。而且因为利用了机器学习，它能够自行更新，从而不再依赖开发者的人工调整和升级。

「相关问题」的兴起

为了让用户的搜索体验更加饱满，谷歌正在逐渐推广「丰富答案」（rich answers）（在传统的搜索结果上方时而出现的简明版「答案」）。最近，谷歌更是推出了「相关问题」，它鼓励用户就其搜索主题进一步进行探索。尤为有趣的的是，目前「相关问题」的答案与各自对应的作为Rich Answers的答案是不同的，也就意味着两者是基于谷歌搜索算法的不同区块的（比如，我们可以谷歌知识图谱（Knowledge Graph）和RankBrain）。无论如何，似乎谷歌正致力于不仅仅理解用户的查询问题，并且简洁明了的回答它们。

三大预测

为了推测出这些观察情况的意义，我想要提供三种预测，预测谷歌接下来十年会如何选择接下来的发展道路：

1.机器学习会成为新的目标。目前，机器学习仅存在于谷歌搜索算法较为优化的一部分。我猜想，它的应用将延伸至其它领域，包括网页内容质量分析（content quality analysis）和上下文反向链接评估（backlink context evaluation）。

2.谷歌将致力于把每一条搜索查询都转化为可回答问句的形式。随着丰富答案及相关问题的积累，很显然谷歌希望向用户提供最直接的信息。我想，我们将会见证谷歌在这个方向更多的努力，包括将基本的查询语句转化为复杂的、可回答的问句。

3.新涌现出的科技将会让更多人转向语音搜索，这自然意味着语义更加复杂的问句和直接回答这些问句的答案。越多的人使用语音搜索，对谷歌来说则意味着更多的数据，对用户来说则是更好的搜索结果——总的来说，我们会得到更加完善的搜索系统。因此，我猜想谷歌会推动更多人在未来的几年里使用语音搜索。

用你觉得合适的方式将这三个预测运用起来：你可以着手采用新的内容营销策略来回应用户的问题；或是使用新的技术进行搜索引擎优化（Search Engine Optimization），以避免机器学习所带来的频繁变化；再或者，你只需等待一个更加容易、更加符合直觉的搜索方式供自己使用。我们无法对未来下定论，但是回首过去短短几年我们取得的巨大进步，可以预想，接下来的十年将是极具开创性的十年。

本文选自Forbes，作者Jayson DeMers，机器之心编译出品，编译：张诗玥，柒柒。

精选推荐

通过对抗性图像黑入大脑

[2018-03-02] 在上面的图片中，左边是一张猫的照片。在右边，你能分辨出它是同一只猫的图片，还是一张看起来相似的狗的图片？这两张图片之间的区别在于， ...

新型轻便机器人套装重5kg，辅助跑步和步行

[2019-10-23] 虽然步行对大多数人来说似乎不是负担，但对有些人来说，这项简单的运动往往会让人感到筋疲力尽。比如手术或中风后恢复的患者、帕金森氏症患 ...

美国普渡大学研发快动作软体机器人，灵感来自变色龙舌头捕食

[2019-10-31] 本文图片均来自：Ramses v Martinez 普渡大学变色龙、蝾螈和许多蟾蜍利用积蓄的弹性能量，向距离1 5倍体长的毫无防备的昆虫伸出粘糊糊的舌 ...

苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展

[2017-12-11] 苹果隐秘的自动驾驶汽车项目多年来一直在转移焦点，但今年似乎正在加速。 4月份，公司获得了在加利福尼亚州进行自动驾驶汽车测试的许可证，而在6月份，苹果公司首席执行官库......

麻省理工最新机器人“装配工”未来可建造太空基地

[2019-10-17] 两个机器人原型把一系列小单元组装成大结构体麻省理工学院科研人员最近提出一种新型机器人技术，即一种小型机器人系统，能够自主地用统一规 ...

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14] 英伟达（Nvidia）和伦敦国王学院（King’s College London）的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络， ...

助力卷积神经网络时空特征学习史上最大行人重识别视频数据集被提出

[2017-12-25] 本文提出了一个大型的、长序列的、用于行人重识别的视频数据集，简称LVreID。与现有的同类数据集相比，该数据集具有以下特点：1）长序列：平均每段视频序列长为200帧，包含丰......

什么是机器人学？机器人学简介

[2017-12-14] 机器人学是工程学与科学的交叉学科，包括机械工程，电气工程，计算机科学等。机器人技术涉及机器人的设计、制造、操作和应用，以及用于控制、感官反馈和信息处理的计算机系统。...

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系[email protected]，我们会立即处理。谢谢配合！

本周栏目热点

顶级AI会议NIPS压轴2017（附PPT、视频、代码大汇总）

[2017-12-19] NIPS，全称神经信息处理系统大会(Conference and Workshop on Neural Information Processing Systems)，是一个关于机器学习和计算神经科学的国际会议。该会议固定在每年的12月举行...

机器学习选择深层模型的原因

[1970-01-01] 深度学习采用的模型为深层神经网络（Deep Neural Networks，DNN）模型，即包含多个隐藏层（Hidden Layer，也称隐含层）的神经网络（Ne ...

机器学习—自由编码器

[1970-01-01] 一种常见的深层模型是由自编码器（Auto-Encoder）构造的。自编码器可以利用一组无标签的训练数据{x(1), x(2), &hellip }（其中x(i)是一个n ...

【NIPS最佳论文出炉】冷扑大师能战胜AlphaZero吗？No（Science论文）

[2017-12-19] 拿下NIPS2017 最佳论文，登上Science，“冷扑大师”最近有点热。18日，两位作者，CMU博士生Noam Brown和Tuomas Sandholm教授在Reddit上回答问题。对“为什么不使用深度学习......

日本开发团队给机器人嵌入神经网络

[2016-08-18] 　　近日在日本国立科学博物馆展出的机器人 Alter，可谓是目前世界上最为先进的机器人之一，因为它是一款嵌入了神经网络的机器人，来自日本 ...

机器学习与语义搜索 谷歌的终极武器是什么？

本周栏目热点

机器学习与语义搜索谷歌的终极武器是什么？