爱吧机器人网 » 资讯 > 企业 > 正文

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮

在今年的谷歌I/O大会上,除了安卓P之外,谷歌还发布了非常重要的硬件:TPU3.0。这是这家科技巨头第三次发布新版本的机器学习专用处理器。

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
AI开销大,谷歌已Allin

人工智能需要大量的计算资源进行训练。但是这个规模有多大?很多人是没概念的。对于大公司来说,对资源的要求非常高,尤其是神经网络,比如谷歌I/O大会大放异彩的安卓电池节约模式和自动亮度调整,就是Deepmind的产品,Deepmind在官方新闻并未透露让手机学习这些行为需要多少资源,但是在围棋项目上可以窥探一下。

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
2000个P100运行两三周才能训练出强大的围棋程序Deepmind训练AlphaGoZero的时候,2000个TPU跑了40天。AlphaZero训练则是调用了5000个TPU。写成论文之后,Facebook在重现论文的时候,则是使用了2000个GPU运行了两三周的时间,这个GPU都是英伟达的P100,一个8GPU的学习服务器英伟达就要卖到上百万人民币。

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
TPU:每小时6.5美元,训练AlphaGo要数百万美元

让巨头们狠下心来自己搞AI硬件的动力来自多个方面,一来谷歌自己做针对TensorFlow优化的TPU效果好,二来现在谷歌云都可以租赁分时使用TPU资源了,对于擅长硬件或是云计算的科技巨头们来说,是时候发展自己的AI硬件了,这正在成为大公司的游戏。

CPU在任务处理器里出现两个核心,可以追溯到十多年前的奔腾四时代,刚刚出现的HyperThreaing技术。不过很多年过去,由于CPU的单个核心任务繁重,所以就算是服务器的版本,核心数也不过20多个就基本到头了。

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
GPU更多的核更适合机器学习和AI在神经网络出现之后,要用计算机系统去模拟更多的人大脑的神经元,这样神经网络在训练的时候对资源的开销非常大。因为神经网络的特点是节点多,这对于核心不多的CPU来说就需要非常大的服务器集群。但是当时人们发现了显卡,单个显卡上面有很多个单元,正好适合训练人工智能的神经网络。

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
在TitanV当中,英伟达加入了640个张量单元用来加速AI训练速度

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
英伟达的股票过去几年成为投资热点,暴涨了数倍而神经网络单个节点并不需要多高的计算能力,这让显卡企业英伟达迅速的推出了针对神经网络、机器学习专用的GPU,过去几年英伟达的股价暴涨数倍。科技巨头们采购的GPU往往以万计,只有这个规模才能满足他们对于探索的需求。

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
DGX-2可以支持单机16个V100GPU现在英伟达成为了业内最大的机器学习GPU的供应商,并且英伟达自己也提供DGX系列机器学习服务器,今年的新款可以单机支持16个GPU,过去是8个。可以说英伟达是AI时代最大硬件赢家也不为过。

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
赢家自信的微笑这里我们回到开头,Facebook训练围棋程序ELF用了多少个GPU?2000个!英伟达总裁黄仁勋还可以笑很久很久。

谷歌最早的GoogleBrain搞机器识图的时候,就是大规模的GPU集群。据说曾经用力上万张GPU来进行学习训练。因为GPU并没有针对性的对谷歌的TensorFlow框架进行优化。而到了和李世石下围棋的版本,则已经开始使用自己的TPU,但是多达50个。

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
谷歌完整经历了从CPU到GPU再到TPU的流程到了与柯洁下棋的时候,可以看到机器已经变成了只要一个4U左右的4TPU服务器就可以,这就是专用芯片的威力,对于AI和神经网络,专用芯片的效率提升是指数式的,而不是线性的几个机架缩小到1个。

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
TPU2.0:四个一张PCB,算力可以达到180TFlops谷歌的TPU全称叫做TensorProcessingUnit,张量处理单元,它针对谷歌的深度学习框架TensorFlow定制开发,TPU推出只有8位的低精度计算,并且有不小的板载内存以减少对内存的访问,但是优化后可以极大的提高机器学习的效率。

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
TPU3.0的高功耗不得不用上水冷散热

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
图片下面8个互联机架有每秒1000万亿次的能力与柯洁下棋的是TPU二代,四个TPU有180TFlops的计算能力。而这两天的谷歌I/O上则推出了TPU3.0版本,功耗进一步加大,使用了水冷。根据谷歌CEOPichai的话说,要比过去快十倍以上:这其实说的是一整个集群模块,可以达到100PFlops,也就是所说的每秒1000万亿次。

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
TPU只是对TensorFlow优化当然TPU不是万能的,它针对的是谷歌的学习框架,而Facebook的学习PyTorch框架基本就没法用,所以目前来说还只是针对性的硬件。

谷歌的TPU本质上是ASIC,当然机器学习不止一条路,微软就在5月7日的Build2018大会上,宣布了ProjectBrainwave的预览版,这其实比谷歌的I/O还早了几天。

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
微软押宝FPGA

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
微软ProjectBrainwave团队负责人DougBurger展示FPGA模块微软押宝的是FPGA(现场可编程门阵列FieldProgrammableGateArray,简称FPGA),微软始终认为FPGA更灵活,可以适应多种机器学习的类型。微软还声称,FPGA可以使用图形识别模型每1.3毫秒就识别一张图片,而根据微软CEOSatyaNadella的演讲,FPGA的延迟要比TPU低5倍。

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
近看FPGA,可以插在全高的PCIE服务器模块上加速AI和深度学习计算微软的FPGA灵活性在于不仅仅支持TPU支持的TensorFlow,也支持微软自己的人工智能认知工具包,前面说的识别图片就是最基础的人工智能应用之一。与谷歌云支持TPU差不多,微软也即将在Azure云中支持FPGA的人工智能、机器学习加速。

最近关于国产半导体的事情闹得沸沸扬扬。其实半导体这种成熟的工业,要追赶的路还很长,不要妄自菲薄,也不要有点成绩就沾沾自喜嚷嚷赶英超美才是正确的态度,路是一步一步走出来的。最近国内的芯片领域的领军企业、具有深厚中国科学院背景的寒武纪就推出了MLU。

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
寒武纪的成品模块与芯片MLU造型上和英伟达标准版的显卡有点像,也是在PCB后部用一个涡轮风扇横向吹风散热的结构,这种结构成熟,可以很容易的放到机箱里面。当然我们更关心的是性能。根据寒武纪官方公布的数字,INT8模式下最高可以达到166.4TFLOPS,大概和谷歌的TPU2.0性能相当。

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
寒武纪会成为中国的英伟达吗?MLU和GPU一样,都相当灵活,可以容易的放到机箱、服务器里面起到专门的AI加速作用,并且MLU的工艺是TSMC的16nm,估计未来国内很多AI领域的研究会围绕MLU展开。

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
机器学习硬件的应用场景,分学习和应用推理两部分

谷歌爸爸放大招:如何追赶人工智能硬件的浪潮
谷歌助手号称已经通过了图灵测试,分辨不出AI与真人的区别今天列举的只是众多的AI硬件当中的几个,还有大量获得千万美元以上风投公司的AI硬件在路上,烧钱背后是人们意识到了AI同过图灵测试之后展现的强大,尤其是谷歌I/O大会上的谷歌助手,让人分辨不出就是是人还是机器。但无论如何,硬件越强大、AI越智能,越能解放我们的双手和劳动力,让真正的大脑投入到思考当中。


上一篇:博世、戴姆勒和英伟达结盟开发无人驾驶出租车
下一篇:华为正准备大力推动人工智能硬件的发展
精选推荐
国外眼科手术机器人为视网膜静脉阻塞患者带来希望
国外眼科手术机器人为视网膜静脉阻塞患者带来希望

[2017-03-20]  视网膜静脉阻塞,简称RVO,对患者来说是一种严重的疾病。该病病因为视网膜静脉中存在血液凝块,这可能导致视力严重下降,在某些情况下,病 ...

谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算
谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算

[2019-10-23]  谷歌坚称自己已经取得了量子霸权——这标志着计算研究领域的一个重要里程碑。谷歌首次发布声明是在今年9月,虽然遭到竞争对手的质疑,但就 ...

智能农业:种地的事儿未来全交给这些机器人吧
智能农业:种地的事儿未来全交给这些机器人吧

[2019-12-07]  SRC公司创始人Sam与温波尔庄园农场经理Callum Weir以及监控机器人Tom总部位于英国的农业科技初创公司SRC(Small Robot Company),正在 ...

亚马逊计划建一个4000万美元的机器人中心
亚马逊计划建一个4000万美元的机器人中心

[2019-11-07]  爱吧机器人网消息,亚马逊11月6日宣布了一项计划,计划在美国马萨诸塞州韦斯特伯勒建立一个4000万美元、35万平方英尺的机器人创新中心。新 ...

CES 2018:英特尔推出49量子位芯片争夺量子霸权
CES 2018:英特尔推出49量子位芯片争夺量子霸权

[2018-01-10]  在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中,英特尔通过了一个关键的里程碑。近日,这个科技巨头已经推出了一个49个量子位 ...

瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作
瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作

[2019-07-12]  EPFL(瑞士联邦理工学院)的研究人员受到了蚂蚁的启发,开发了一款仅有10克重的小型机器人:他们可以相互交流,分配角色并完成复杂的任务。 ...

机器人工程师具体都做什么?
机器人工程师具体都做什么?

[2017-12-08]  机器人工程师是幕后设计师,负责创建机器人和机器人系统,能够执行人类无法完成或不愿意完成的任务。 通过他们的创造,机器人工程师帮助工作更安全,更轻松,更高效,特别是......

麻省理工最新机器人“装配工”未来可建造太空基地
麻省理工最新机器人“装配工”未来可建造太空基地

[2019-10-17]  两个机器人原型把一系列小单元组装成大结构体麻省理工学院科研人员最近提出一种新型机器人技术,即一种小型机器人系统,能够自主地用统一规 ...

本周栏目热点

将NLU技术引入企业服务领域,ForeTHought获900万美元A轮融资

[2018-12-07]  近日, ForeTHought宣布已经获得了由New Enterprise Associates领投的900万美元A轮融资,该公司希望将NLU技术引入企业领域,致力于帮助“知识类专员”,例如客户服务代表等......

星逻智能发布无人机综合操作系统UltraHive Mk 3“启”

[2019-07-10]  6月20-22日,2019世界无人机大会在深圳隆重举办,来自国内外的四百多家企业参会,千余架无人机精彩亮相。为赋能无人机而生的星逻智能自然不 ...

分拣机器人创企Covariant B轮融资4000万美元!打包准确率达99%

[2020-05-08]  昨日,机器人创企Covariant宣布完成4000万美元B轮融资,以将其机器人控制系统引入更多行业,并开发出更多有拾取、放置和卸载仓库中物体功能 ...

双足机器人Cassie获投5000万 致力于解决快递运送最后30米

[2018-04-17]  腿足机器人,一直以来都是一个神奇的存在。虽然近几年发展势头很猛,但除去应用于科研平台,很少有人把它真正应用于产业化(玩具类机器人除 ...

2019年亏损11亿元的寒武纪是否可以成为明日之芯?

[2020-04-03]  寒武纪是一家人工智能芯片设计商,主营业务为各类云服务器、边缘计算设备、终端设备中人工智能核心芯片的研发生产销售。目前,寒武纪的主要 ...