爱吧机器人网 » 专题 > 观点 > 正文

和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略

谷歌方面强调,不会在这款小程序内收集任何与用户隐私相关的数据。

本文共计2670字,阅读时间4分钟。

本文为寻找中国创客(ID:xjbmaker)原创

记者 / 蔡浩爽

编辑 / 魏佳

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
谷歌一定是全球最会做营销的人工智能公司,没有之一。

2016年,谷歌阿尔法狗与人类顶级棋手对弈,让全人类意识到人工智能时代的到来;2018 Google I/O开发者大会上,Google Assistant像真人助理一样通过电话完成预约理发服务,宣告人工智能距离“成精”又近一步;今天,谷歌的你画我猜小程序“猜画小歌”刷屏朋友圈,让普罗大众都有“调戏”人工智能的机会。

“AI没有你想象中的那么神奇,可以上天入地干掉人类;也没有你想象中的那么智障,还是可以做一些传统代码做不到的事情的。”谷歌的猜画小歌研发团队人员如此解释上线这一小程序的目的。

猜画小歌炸出了朋友圈一票灵魂画手,其不按套路出牌的识别能力让人又爱又恨:猜画小歌有时候很懂你,画一笔就知道你要画什么;有时候又着实智障,明明画得很具体了,它却用机械音嘲弄你:“你画的啥玩意。”有绘画功底的画手往往难以通关,抽象派的灵魂画手反而能被识别。网友忍不住质疑:这 AI 怕不是个傻子吧?

猜画小歌背后使用了哪些技术?这一技术未来可以应用在哪些领域?谷歌AI团队就这些问题接受了寻找中国创客(ID:xjbmaker)的采访。

猜画原理

技术不难,难的是数据库

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
我们先简单介绍一下这款小程序游戏的玩法:系统给出一个需要画的词语,通常是名词,在20秒的时间内,用户画AI猜,猜中即可进入下一轮。AI从你画第一笔就开始猜,常常在你画出某些特征后就给出答案。如果猜不中,AI还会用机械音嘲笑:你画的啥玩意。

据开发人员介绍,这款小程序最初只是团队hackathon的小想法,因为大家觉得有趣,才发展成了完整的项目。

所谓hackathon,中文一般称为黑客马拉松或者编程马拉松,是科技公司激发创意的一个小比拼。常见的做法是公司内程序员、设计师以及产品人员组成小队,在一到两天的时间内紧密配合,完成一个主题下的产品或者解决方案。

2016年以来,微信小程序因为已经封装了很多组件、提供了很多接口,开发相对简单、快速,成为了很多互联网公司首选的hackathon主题。猜画小歌就是在这样的环境中诞生的。

Google AI工作人员告诉寻找中国创客(ID:xjbmaker),猜画小歌由来自Google AI的神经网络驱动。该网络源自全世界最大的、囊括超过5000万个手绘素描的数据群。

2016年,谷歌曾推出网页版你画我猜——quick,draw!一经上线就风靡全球,通过该游戏手机到的手绘数据集也被谷歌开源,为需要神经网络训练的研发人员提供样本。quick,draw!使用了David Ha与Douglas Eck研究的名为“sketch-rnn”的生成式RNN,旨在训练机器如何像人类一样提炼事物的抽象概念。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
至于这次猜画小歌具体使用的是神经网络技术中的卷积神经网络技术(CNN)还是递归神经网络技术(RNN),谷歌方面表示:无法分享关于神经网络架构的相关信息。

“其实用CNN或RNN只不过是个选择题,这两种神经网络各有长处,但归根结底都是DeepLearning(深度学习)的事情。” 人工智能独角兽企业旷视科技研究人员告诉寻找中国创客(ID:xjbmaker)

神经网络是深度学习的基础,最初是受生物神经系统的启发,为了模拟生物神经系统而出现的。通俗点说,AI 通过神经网络认知世界的过程,与婴儿最初认知世界的过程颇有点异曲同工的意思。

包括旷视研究院在内的人工智能公司所研究的人脸识别、视频结构化等技术,均绕不开CNN或RNN。

但抛开这些拗口的技术名词,这款手绘识别游戏的技术并不难。早在去年,就有一名在校生帮一个公司做过一个几乎差不多的手绘识别模型,收取的酬劳仅有一万元。相比于算法,数据集在这里显然更值钱。

回想一下,我们人类会通过识图卡片、绘画等来培养孩子识别周遭事物的能力,这些图画并不一定像照片一样逼真,但包含了事物的显性特征,传递出了人们如何重现与重构身边事物的方法。比如猫有三根胡须、汽车有四个轮子、人脸有两只眼睛一个鼻子一张嘴、金毛是有金色毛发的温顺狗狗等。“AI 对简笔画的理解也是基于数据库的训练。”旷视科技研究人员告诉寻找中国创客(ID:xjbmaker)

利用神经网络技术,通过对大量涂鸦样本的学习,猜画小歌总结出不同事物的特征点。除了特征点,数据训练也可以给AI动态的画图过程,让AI理解人类在画某一事物时通常选择第一笔先画什么、如何走笔、合适停笔。这也解释了为何有时在你画第一笔时,小歌就能给出答案。

数据库规模越庞大,结果准确率越高。谷歌研发人员表示,为了让AI能够猜出大家的画作,已经提前喂了大量的数据给模型。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略

答“阴谋论”:不会收集用户隐私数据



虽然朋友圈的灵魂画手们玩得不亦乐乎,但依然有不少网友对人工智能保持着高度警惕:“感觉这个小程序有大阴谋啊,这要是都识别了,数据收集起来,谷歌不得了了,机器人可以识别所有东西了。”

还有人担心自己不知不觉成为谷歌的免费训练师,用自己的画作丰富了谷歌的涂鸦数据集。

研发人员回应:这其实是大家想多了。“大家的画作,除非能达到一定的量级,不然是不会对AI本身产生重大的影响的。”

谷歌方面也对寻找中国创客(ID:xjbmaker)强调,不会在这款小程序内收集任何与用户隐私相关的数据。

谷歌方面也对寻找中国创客强调,不会在这款小程序内收集任何与用户隐私相关的数据。

但其实,谷歌并未正面回应是否会将用户涂鸦用于丰富手绘数据库。旷视科技研究人员认为,用小程序上的涂鸦来丰富数据库是必然的。

而旷视研究人员则认为,用小程序上的涂鸦来丰富数据库是必然的。

在应用前景方面,鉴于该数据集可以训练机器提炼事物的抽象概念、学习动态画图过程,这就为这一技术创造了一个前景可观的应用方向:帮助艺术家迸发艺术灵感、教授学生绘画的基本技巧。

除了锻炼AI 能力,猜画小歌收集的数据或许也可以有其他用武之地,比如分析一下为什么大多数人画钟表都是在3点钟。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
业内有观点认为,谷歌此次用小程序试水,不失为回归中国市场的投石问路之举。

2017年12月,谷歌宣布成立谷歌AI中国中心,整合谷歌云与谷歌中国研发团队,由斯坦福大学计算机系终身教授、斯坦福大学人工智能实验室主任、"AI 女神"李飞飞与Google Cloud研发负责人李佳领导。

谷歌AI中国中心介绍,目前Google翻译和文件极客App可在中国使用,搭载Android Wear系统的可穿戴产品在中国也非常受欢迎。

登顶攻略:注意突出特征和勾勒形状

有一定绘画基础的汤包同学在朋友圈里愤愤不平:既然已经喂了这么多数据,为什么我的小歌还是表现得像个智障?

汤包画的鱼是这样的:

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
系统认可的鱼是这样的:

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
汤包笔下的眼镜是这样的:

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
而实际上想要被AI识别出,只需要画两个圆圈:

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
小S(化名)为了画出“动物迁徙”,费劲巴拉地画了两只行进中的斑马,但实际上,她只需要画两只大雁——也就是两条折线就好。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
“这可能是因为它之前训练的数据集以简笔画为主,复杂的反而不认识。”旷视科技研究人员认为,小歌出现的这个bug 还是跟数据集有关,“它现在还不够聪明。”

那么,怎么才能让小歌更容易地识别出你的涂鸦?

一个诀窍是抓住特征。

比如画猪突出硕大的鼻孔,画蚊子突出尖尖的嘴,画蒙娜丽莎的微笑先画个画框。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
第二个诀窍是先勾勒形状,画脸先画圆圈,画微波炉先画个正方形,小歌多猜几次总能猜对。

当然,反推下来,如果你想为难一下小歌,大可以颠倒以往的下笔顺序,画图时先画细节,这样无论你画得有多像,小歌都有很大概率识别不出。


上一篇:为什么我要费尽心思造出一个不完美的绘画机器人?
下一篇:中国AI企业融资总额占全球70% 巨大的繁荣背后到底隐藏了什么
精选推荐
人工智能准确预测患者一年内的死亡风险,原理却无法解释
人工智能准确预测患者一年内的死亡风险,原理却无法解释

[2019-11-13]  图片来自BURGER PHANIE SCIENCE PHOTO LIBRARY美国最新研究显示,人工智能通过查看心脏测试结果,以高达85%以上的准确率预测了一个人在一 ...

英国首台月球车是个小型四腿机器人 将于2021年登月
英国首台月球车是个小型四腿机器人 将于2021年登月

[2019-10-12]  探测器将用四条腿探测月球表面,并将数据传回着陆器,后者将把数据传回地球图 詹姆斯温斯皮尔英国即将成为继美国、俄罗斯、中国之后的又一 ...

MIT研制出可以像植物一样生长的机器人
MIT研制出可以像植物一样生长的机器人

[2019-11-09]  麻省理工学院开发了一种新型机器人,这种机器人可以本质上自我延伸,其生长方式与植物幼苗向上生长的方式惊人相似。值得注意的是,研究人员 ...

机器人工程师具体都做什么?
机器人工程师具体都做什么?

[2017-12-08]  机器人工程师是幕后设计师,负责创建机器人和机器人系统,能够执行人类无法完成或不愿意完成的任务。 通过他们的创造,机器人工程师帮助工作更安全,更轻松,更高效,特别是......

亚马逊计划建一个4000万美元的机器人中心
亚马逊计划建一个4000万美元的机器人中心

[2019-11-07]  爱吧机器人网消息,亚马逊11月6日宣布了一项计划,计划在美国马萨诸塞州韦斯特伯勒建立一个4000万美元、35万平方英尺的机器人创新中心。新 ...

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私
英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14]  英伟达(Nvidia)和伦敦国王学院(King’s College London)的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络, ...

人工神经网络技术解码人类行为和想象时的大脑活动信号
人工神经网络技术解码人类行为和想象时的大脑活动信号

[2017-08-23]  为搜索引擎过滤信息,棋盘游戏对弈,识别图像 人工智能在某些任务中远远超过了人类智能。来自弗莱堡由神经科学家私人讲师Tonio Ball博士领导的几个杰出的BrainLinks-Bra......

谷歌在中国成立一个新的人工智能(AI)研究中心
谷歌在中国成立一个新的人工智能(AI)研究中心

[2017-12-13]  谷歌正在中国建立一个新的人工智能(AI)研究中心,希望进一步扩展到中国,以充分利用中国高度重视的人工智能技术。人工智能是目前地球上最具竞争力的领域之一,亚马逊,微软......

本周栏目热点

李开复:关于人工智能在中国异军突起的六大主要原因

[2017-11-07]  虽然世界各个国家都已经开始加速对人工智能行业进行布局,虽然世界各国都已经出台了各种政策表示对人工智能的支持,但是就目前的发展形势来看,中美两国在人工智能领域的发展......

[2018-02-05]  “人工智能国际主流学界所持的目标是弱人工智能,也少有人致力于强人工智能。那么,这是不是因为强人工智能‘太难’,所以大家‘退而求其次’呢?不然。事实上,绝大多数人工......

阿里研究院:关于互联网+制造业的10个观点(组图)

[2015-12-29]     互联网对商业环节的渗透和改造是逆向的,从与消费者最近的广告营销端开始, ...

2020年中国AI基础数据服务行业发展报告

[2020-04-03]  核心摘要:目前人工智能商业化在算力、算法和技术方面基本达到阶段性成熟,想要更加落地,解决行业具体痛点, 需要大量经过标注处理的相关 ...

【业界观点】2016年工业机器人需求增速将放缓

[2016-01-19]     2015年中国工业机器人需求规模达到109亿元,同比增长16%,而2016年机器人需 ...