爱吧机器人网 » 技术 > 人工智能 > 正文

百度大脑3.0技术与能力一览

核心提示:7月4日,一年一度的百度AI开发者大会在京如期举行。大会现场,百度不仅分享了公司在AI技术、产品与平台等方面的研究成果与最新进展,还宣布了百度大脑的重磅升级,3 0版本正式问世。

原标题:作为百度AI技术的集大成者,最新升级的百度大脑3.0有何亮点?

百度大脑3.0技术与能力一览。

7月4日,一年一度的百度AI开发者大会在京如期举行。

大会现场,百度不仅分享了公司在AI技术、产品与平台等方面的研究成果与最新进展,还宣布了百度大脑的重磅升级,3.0版本正式问世。

为此,百度高级副总裁、AI技术平台体系(AIG)总负责人王海峰亲自站台对其展开了详细的解读。

\

「百度大脑3.0可以说是百度AI技术的集大成者。」王海峰如是说。

众所周知,百度在AI技术上有着长期的投入和积累。在回顾百度AI技术的发展历程时,王海峰提到了三个重要的时间节点。

2000年,也就是十八年前,百度作为一家搜索公司诞生。由于搜索引擎背后除了互联网技术的支持,也离不开自然语言处理、信息检索等AI技术,因此在王海峰看来,百度从诞生的那一天起就开始了AI技术的研发与应用。

而在八年前的2010年,百度开始全面布局AI技术,先后开展了自然语言处理、计算机视觉、机器学习、数据挖掘、知识图谱等AI技术的研发。

两年后,百度开始着手深度学习技术的研发与应用,并在当年的百度图像语音等应用中正式上线。

鉴于深度学习技术在实际应用中的惊艳表现,百度在2013年成立了世界上第一个深度学习研究院,同时将深度学习技术率先应用于大规模线上搜索引擎之中,并于2015年上线了基于神经网络的机器翻译系统。

经过了十六年的积累,百度的AI技术日渐成熟。在此基础上,百度于2016年正式发布百度大脑1.0,不仅供百度内部使用,还向开发者开放。

当时1.0版本的百度大脑在完成了基础能力的搭建之后,仅仅实现了语音、图像、用户画像和PaddlePaddle深度学习框架等核心技术的初步开放。

\

百度大脑基础架构

而伴随着时间的推移,百度大脑也逐渐塑造成型。

去年开发者大会发布的百度大脑2.0已经形成了完整的AI技术体系,向开发者开放的能力也超过了60项能力,既有各方面AI核心技术,也有场景化能力及解决方案。

而此次发布的百度大脑3.0在开放的能力数量方面又有了新的提升——已经超过110项。

王海峰表示,今早他看到的最新数字是117项。

而在能力数量增加的同时,百度的AI技术能力也在不断增强。王海峰介绍,此次百度大脑3.0的最核心技术,用一句话概括,就是多模态深度语义理解。

具体而言,就是对文字、声音、图片、视频等多模态的数据和信息进行深层次多维度的语义理解,包括数据语义、知识语义、视觉语义、语音语义一体化和自然语言语义等多方面的语义理解技术。

换句话说,就是不仅要让机器可以听清、看清,还要能够深入理解其背后的含义,从而更好地支撑各种应用。

\

百度大脑3.0核心技术——多模态深度语义理解

在AI领域,数据的重要性自不用提。无论是物理世界、人类社会还是网络空间,都充斥着海量的多元、异构、多模态的三元空间大数据

那么如何最大程度发挥这些数据的价值呢?

这就需要对数据进行加工、处理、挖掘和分析,实现数据的语义化进而加以利用。

为此,百度通过统一表征、关联计算,构建包含千亿节点、万亿关系的庞大数据语义网络,并在此基础上总结规律、提炼知识,进而助力经济和社会的发展。

王海峰举了一个新能源充电桩智能运维的例子。

结合百度的大数据、深度学习等技术,对充电桩设备数据进行采集、传输、存储、分析,就可以实现设备监测、故障诊断、预测性维保等,在提升效率的同时也大幅节约了成本。

\

当然,除了数据,理解大千世界中的多元知识也是打磨AI技术中的重要一环。而要构建出详尽而完备的知识图谱却并非易事,需要巧妙理清繁杂的垂直领域知识、梳理其中的逻辑。

而在这件事上,百度所投入的资源与人力显而易见,目前已经构建了包含数亿实体、数千亿级事实的庞大知识图谱。

除了基础的由实体、属性、关系构成的实体图谱,百度还针对不同的应用场景和知识形态,构建了关注点图谱、事件图谱、多媒体图谱、行业知识图谱等多种图谱。

「知识图谱是人类进步的重要阶梯。」王海峰解释道,百度所掌握的这些知识是构建百度大脑的重要基础。

以世界杯相关的知识图谱为例,实体图谱可以看到热门球队、热门球星、赛场、赛程和主题歌等信息;关注点图谱可以体现用户对于C罗和梅西的兴趣所向;多媒体图谱则包括图片、音乐和视频;行业图谱和事件图谱覆盖了足球规则的各种知识和近9届世界杯的大事件。

这些不同类型的图谱通过关系关联起来,也会延展出新的图谱,构成庞大的多元语义知识网络。

大会现场,百度还播放了一段世界杯球赛视频,展示了百度大脑的视觉语义理解能力。视频中,系统不仅可以全面识别视频中的球员、裁判、球、以及球门、球场线等人、物和场景,还可以捕捉射门、进球、角球、任意球、换人等事件。

基于这些结构化语义信息,既可以完成机器人自动解说,也可以进行精彩片段集锦以及各种数据统计分析等。

\

百度大脑视觉语义能力在足球赛事中的展现

而在日常生活场景中,百度大脑的视觉语义理解能力也能够发挥作用。

在无人超市购物场景下,系统可以通过摄像头对超市中的人、货、场进行全方位识别,然后将图像信息进行时序化和结构化,让购物机器人能够掌握环境信息进而完成自动避障并引导顾客行进,让系统得以实时掌握顾客取拿的商品。

对于时下大热的无人零售领域,这项技术无疑是一种必不可少的存在。

\

百度大脑视觉语义能力在无人超市场景中的展现

在为「眼睛」赋予了理解能力后,百度大脑自然不会放过人类最重要的交流媒介——语音和语言。

在语音技术方面,百度大脑在高噪声环境Hand-free语音识别准确率上提升了10个百分点。与此同时,百度大脑采用语音语义一体化技术使得远场语音识别准确率也提升了10个百分点。

而为了让整个对话过程更加自然,百度大脑在语音的合成上采用拼接了WaveNet+的情感语音合成技术,如此一来,既可以使得交互的流畅度大幅提升,又避免了计算量过大的问题。

目前,新版百度地图中的小度语音助手已经可以理解复杂的语义请求,面对「我要从三里屯的团结湖地铁站出发、路过望京家乐福、然后再去南锣鼓巷最后到我家,要红绿灯少的、不堵车的最快路径」这样的请求也丝毫不惧。

王海峰介绍,在对话理解上,百度研发了最新的深层注意力匹配模型并将其引入到系统之中,比已知的最好结果提升了4.1%。从优化前后的结果来看,引入这种模型的对话交互的确更加自然。

\

而在阅读理解上,百度大脑已经阅读了千亿量级的文章,相当于6万个中国国家图书馆的藏书,积累了亿级实体、千亿事实的知识。

以葡萄牙和西班牙的比赛为例,通过阅读网上大量相关新闻,百度大脑不仅了解比赛的事件与主题,还能与用户进行问答及推荐互动。可以发现,通过持续获取和积累知识,百度大脑的智能水平得到了显著提升。

\

而在百度大脑各项技术与能力升级的背后,是百度在底层技术上的不断打磨与迭代,也离不开深度学习框架PaddlePaddle的支持。

\

2012年,百度开始深度学习技术的研发,并从2013年自主研发深度学习平台,并让其服务于百度的多项核心业务。

在2016年9月,百度对外发布了自己的深度学习框架PaddlePaddle。一年后,百度发布新一代深度学习框架PaddlePaddleFluid。

而今,百度的深度学习框架再次实现升级。王海峰在大会现场发布了最新版本——PaddlePaddle3.0。

据王海峰介绍,PaddlePaddle3.0核心框架还包括三个重要平台,分别为快速应用平台EasyDL、网络结构自动化设计AutoDL以及在线实训平台AIStudio。

\

其中,EasyDL平台可以让零基础开发者迅速定制自己的应用,大幅降低了人们进入AI领域的门槛。

\

EasyDL在制造业键盘组装合格性检测上的能力

而对于那些有基础的开发者来说,设计深度学习网络结构是一项相对耗时耗力的工作,AutoDL的存在就是致力于帮助开发者节省设计深度学习网络结构的时间。

\

人工设计的网络结构与AutoDL网络设计效果比对

「我们不止是把核心算法做了升级,同时在服务器端以及移动端都有各自相应的服务可以支持各种场景的应用。」王海峰补充道。

在谈到深度学习框架与AI生态的关系时,王海峰认为深度学习框架可以类比为AI的操作系统,向下可以与AI芯片结合。

要知道,AI芯片在对AI模型的计算进行专门优化后,性能会有很大的提升。从这个角度出发,王海峰表示深度学习框架相当于AI芯片的指令集。

值得一提的是,此次大会百度还发布了一款云端全功能AI芯片「昆仑」,主打高性能、高性价比、易用三大特点。百度表示,其运算能力比最新基于FPGA的AI加速器,性能提升了近30倍。

当然,没有经过真实场景使用的技术都是纸上谈兵,实践与应用才是培育技术最佳土壤。王海峰透露,目前百度大脑每天的调用次数已经超过了4090亿次,调用的人既有AI工程师,也有零AI基础的初入门者,还有来自各行各业希望用AI创新业务、为业务转型升级的企业。

不难想象,这些庞大的开发者群将成为百度大脑迭代更新路上的最大助力。

「估计明年我们再站在这里的时候就需要更大的屏幕来展示百度大脑开放给开发者的能力了。」王海峰总结说,「我们更希望我们的能力可以帮助开发者获得属于自己的成功,这也是我们最大的心愿。」

\

上一篇:深度研报:六大视角解读人工智能,AI岂止于技术
下一篇:当今人工智能的实际情况

本周栏目热点

[2016-03-03]      在百度看来,索引真实世界,连接3600行将是未来世界的真实描绘。连接成为今 ...

百度大脑3.0技术与能力一览

[2018-07-05]  7月4日,一年一度的百度AI开发者大会在京如期举行。大会现场,百度不仅分享了公司在AI技术、产品与平台等方面的研究成果与最新进展,还宣布了百度大脑的重磅升级,3 0版本正式问世。...

人工智能关键技术决定机器人产业的前途

[2018-07-17]  机器人的技术按照通常的理解分为三个部分,感知、认知和行为控制。感知主要是基于视觉,听觉及各种传感器的信息处理;认知部分则负责更高层的语义处理,如推理,规划,记忆,......

[2018-01-09]  人工智能、机器人和自动驾驶已成为流行文化的前沿,甚至是政治表述。而去年人工智能的研究也让我们相信这不是一个失败的开端,而是一个拐点。在这份报告中,高盛从宏观(...

[2018-06-21]  近日,贵州省人民政府公开发布《关于促进大数据云计算人工智能创新发展加快建设数字贵州的意见》,计划到2020年,信息化驱动现代化能力明显提升,互联网、大数据、云计算、人......

《中国人工智能发展报告2018》4个方面描绘中国AI发展全貌

[2018-07-17]  7月13日,《中国人工智能发展报告2018》在清华大学主楼接待厅发布。报告从科技产出与人才投入、产业发展和市场应用、发展战略和政策环境、以及社会认知和综合影响四个方面描绘......

当今人工智能的实际情况

[2018-07-17]  看一下人工智能领域--过去、现在、不同类型的人工智能以及未来的发展方向。 人工智能(AI)的概念已存在了数千年。人工智能的故事纵贯整个历 ...

人工智能与军事作战效能评估

[2018-07-17]  人工智能(AI)作为致力于基于证据的效应测量的更广泛方法的一部分,可以使我们更接近白鲸。它可以作为衡量情绪或是行为意图的显性指标,它可以跨越时空。即使我们使用AI开发......

精选推荐

美国喷气推进实验室的AI驱动无人机挑战人类飞行员
美国喷气推进实验室的AI驱动无人机挑战人类飞行员

[2017-12-08]  随着无人机及其组件越来越小,效率越来越高,功能越来越强大,我们已经看到越来越多的研究开始让无人机自主飞行在半结构化的环境中,而不依赖于外部定位。 宾夕法尼亚大学在......

CES 2018:英特尔推出49量子位芯片争夺量子霸权
CES 2018:英特尔推出49量子位芯片争夺量子霸权

[2018-01-10]  在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中,英特尔通过了一个关键的里程碑。近日,这个科技巨头已经推出了一个49个量子位 ...

德国研发出一种能在你体内工作的微型机器人

[2018-01-26]  纽约时报的报道,德国的研究人员已经开发出一种长约七分之一英寸的机器人,首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路,跳跃,爬行,滚动和游泳。它甚至爬出......

7种常见的机器人焊接类型
7种常见的机器人焊接类型

[2017-12-17]  机器人焊接是工业领域最常见的机器人应用之一,近几十年来主要由汽车行业驱动。机器人焊接在完成大批量,重复性的焊接任务时效率最高。...

比利时研发出可以自我愈合伤口的软体机器人
比利时研发出可以自我愈合伤口的软体机器人

[2017-09-03]  软体机器人是机器人技术的新兴领域; 他们“可以与人类相互作用,而不会杀死他们,并拿起像西红柿这样柔软的物体。” 从长远来看,布鲁塞尔大学队伍正在努力创建一个类似的材......

苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展
苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展

[2017-12-11]  苹果隐秘的自动驾驶汽车项目多年来一直在转移焦点,但今年似乎正在加速。 4月份,公司获得了在加利福尼亚州进行自动驾驶汽车测试的许可证,而在6月份,苹果公司首席执行官库......

谷歌在中国成立一个新的人工智能(AI)研究中心
谷歌在中国成立一个新的人工智能(AI)研究中心

[2017-12-13]  谷歌正在中国建立一个新的人工智能(AI)研究中心,希望进一步扩展到中国,以充分利用中国高度重视的人工智能技术。人工智能是目前地球上最具竞争力的领域之一,亚马逊,微软......

这些人型机器人是如此真实,你的肉眼几乎无法区分
这些人型机器人是如此真实,你的肉眼几乎无法区分

[2017-09-03]   我们生活在一个区分现实与幻想变得越来越困难的世界。由于机器人技术的进步,创造人工的人类正在逐渐接近完美的最终目标。我们现在看到的机器人不再只是一块发光二极管,......