爱吧机器人网 » 专题 > 观点 > 正文

和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略

谷歌方面强调,不会在这款小程序内收集任何与用户隐私相关的数据。

本文共计2670字,阅读时间4分钟。

本文为寻找中国创客(ID:xjbmaker)原创

记者 / 蔡浩爽

编辑 / 魏佳

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
谷歌一定是全球最会做营销的人工智能公司,没有之一。

2016年,谷歌阿尔法狗与人类顶级棋手对弈,让全人类意识到人工智能时代的到来;2018 Google I/O开发者大会上,Google Assistant像真人助理一样通过电话完成预约理发服务,宣告人工智能距离“成精”又近一步;今天,谷歌的你画我猜小程序“猜画小歌”刷屏朋友圈,让普罗大众都有“调戏”人工智能的机会。

“AI没有你想象中的那么神奇,可以上天入地干掉人类;也没有你想象中的那么智障,还是可以做一些传统代码做不到的事情的。”谷歌的猜画小歌研发团队人员如此解释上线这一小程序的目的。

猜画小歌炸出了朋友圈一票灵魂画手,其不按套路出牌的识别能力让人又爱又恨:猜画小歌有时候很懂你,画一笔就知道你要画什么;有时候又着实智障,明明画得很具体了,它却用机械音嘲弄你:“你画的啥玩意。”有绘画功底的画手往往难以通关,抽象派的灵魂画手反而能被识别。网友忍不住质疑:这 AI 怕不是个傻子吧?

猜画小歌背后使用了哪些技术?这一技术未来可以应用在哪些领域?谷歌AI团队就这些问题接受了寻找中国创客(ID:xjbmaker)的采访。

猜画原理

技术不难,难的是数据库

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
我们先简单介绍一下这款小程序游戏的玩法:系统给出一个需要画的词语,通常是名词,在20秒的时间内,用户画AI猜,猜中即可进入下一轮。AI从你画第一笔就开始猜,常常在你画出某些特征后就给出答案。如果猜不中,AI还会用机械音嘲笑:你画的啥玩意。

据开发人员介绍,这款小程序最初只是团队hackathon的小想法,因为大家觉得有趣,才发展成了完整的项目。

所谓hackathon,中文一般称为黑客马拉松或者编程马拉松,是科技公司激发创意的一个小比拼。常见的做法是公司内程序员、设计师以及产品人员组成小队,在一到两天的时间内紧密配合,完成一个主题下的产品或者解决方案。

2016年以来,微信小程序因为已经封装了很多组件、提供了很多接口,开发相对简单、快速,成为了很多互联网公司首选的hackathon主题。猜画小歌就是在这样的环境中诞生的。

Google AI工作人员告诉寻找中国创客(ID:xjbmaker),猜画小歌由来自Google AI的神经网络驱动。该网络源自全世界最大的、囊括超过5000万个手绘素描的数据群。

2016年,谷歌曾推出网页版你画我猜——quick,draw!一经上线就风靡全球,通过该游戏手机到的手绘数据集也被谷歌开源,为需要神经网络训练的研发人员提供样本。quick,draw!使用了David Ha与Douglas Eck研究的名为“sketch-rnn”的生成式RNN,旨在训练机器如何像人类一样提炼事物的抽象概念。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
至于这次猜画小歌具体使用的是神经网络技术中的卷积神经网络技术(CNN)还是递归神经网络技术(RNN),谷歌方面表示:无法分享关于神经网络架构的相关信息。

“其实用CNN或RNN只不过是个选择题,这两种神经网络各有长处,但归根结底都是DeepLearning(深度学习)的事情。” 人工智能独角兽企业旷视科技研究人员告诉寻找中国创客(ID:xjbmaker)

神经网络是深度学习的基础,最初是受生物神经系统的启发,为了模拟生物神经系统而出现的。通俗点说,AI 通过神经网络认知世界的过程,与婴儿最初认知世界的过程颇有点异曲同工的意思。

包括旷视研究院在内的人工智能公司所研究的人脸识别、视频结构化等技术,均绕不开CNN或RNN。

但抛开这些拗口的技术名词,这款手绘识别游戏的技术并不难。早在去年,就有一名在校生帮一个公司做过一个几乎差不多的手绘识别模型,收取的酬劳仅有一万元。相比于算法,数据集在这里显然更值钱。

回想一下,我们人类会通过识图卡片、绘画等来培养孩子识别周遭事物的能力,这些图画并不一定像照片一样逼真,但包含了事物的显性特征,传递出了人们如何重现与重构身边事物的方法。比如猫有三根胡须、汽车有四个轮子、人脸有两只眼睛一个鼻子一张嘴、金毛是有金色毛发的温顺狗狗等。“AI 对简笔画的理解也是基于数据库的训练。”旷视科技研究人员告诉寻找中国创客(ID:xjbmaker)

利用神经网络技术,通过对大量涂鸦样本的学习,猜画小歌总结出不同事物的特征点。除了特征点,数据训练也可以给AI动态的画图过程,让AI理解人类在画某一事物时通常选择第一笔先画什么、如何走笔、合适停笔。这也解释了为何有时在你画第一笔时,小歌就能给出答案。

数据库规模越庞大,结果准确率越高。谷歌研发人员表示,为了让AI能够猜出大家的画作,已经提前喂了大量的数据给模型。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略

答“阴谋论”:不会收集用户隐私数据



虽然朋友圈的灵魂画手们玩得不亦乐乎,但依然有不少网友对人工智能保持着高度警惕:“感觉这个小程序有大阴谋啊,这要是都识别了,数据收集起来,谷歌不得了了,机器人可以识别所有东西了。”

还有人担心自己不知不觉成为谷歌的免费训练师,用自己的画作丰富了谷歌的涂鸦数据集。

研发人员回应:这其实是大家想多了。“大家的画作,除非能达到一定的量级,不然是不会对AI本身产生重大的影响的。”

谷歌方面也对寻找中国创客(ID:xjbmaker)强调,不会在这款小程序内收集任何与用户隐私相关的数据。

谷歌方面也对寻找中国创客强调,不会在这款小程序内收集任何与用户隐私相关的数据。

但其实,谷歌并未正面回应是否会将用户涂鸦用于丰富手绘数据库。旷视科技研究人员认为,用小程序上的涂鸦来丰富数据库是必然的。

而旷视研究人员则认为,用小程序上的涂鸦来丰富数据库是必然的。

在应用前景方面,鉴于该数据集可以训练机器提炼事物的抽象概念、学习动态画图过程,这就为这一技术创造了一个前景可观的应用方向:帮助艺术家迸发艺术灵感、教授学生绘画的基本技巧。

除了锻炼AI 能力,猜画小歌收集的数据或许也可以有其他用武之地,比如分析一下为什么大多数人画钟表都是在3点钟。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
业内有观点认为,谷歌此次用小程序试水,不失为回归中国市场的投石问路之举。

2017年12月,谷歌宣布成立谷歌AI中国中心,整合谷歌云与谷歌中国研发团队,由斯坦福大学计算机系终身教授、斯坦福大学人工智能实验室主任、"AI 女神"李飞飞与Google Cloud研发负责人李佳领导。

谷歌AI中国中心介绍,目前Google翻译和文件极客App可在中国使用,搭载Android Wear系统的可穿戴产品在中国也非常受欢迎。

登顶攻略:注意突出特征和勾勒形状

有一定绘画基础的汤包同学在朋友圈里愤愤不平:既然已经喂了这么多数据,为什么我的小歌还是表现得像个智障?

汤包画的鱼是这样的:

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
系统认可的鱼是这样的:

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
汤包笔下的眼镜是这样的:

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
而实际上想要被AI识别出,只需要画两个圆圈:

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
小S(化名)为了画出“动物迁徙”,费劲巴拉地画了两只行进中的斑马,但实际上,她只需要画两只大雁——也就是两条折线就好。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
“这可能是因为它之前训练的数据集以简笔画为主,复杂的反而不认识。”旷视科技研究人员认为,小歌出现的这个bug 还是跟数据集有关,“它现在还不够聪明。”

那么,怎么才能让小歌更容易地识别出你的涂鸦?

一个诀窍是抓住特征。

比如画猪突出硕大的鼻孔,画蚊子突出尖尖的嘴,画蒙娜丽莎的微笑先画个画框。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
第二个诀窍是先勾勒形状,画脸先画圆圈,画微波炉先画个正方形,小歌多猜几次总能猜对。

当然,反推下来,如果你想为难一下小歌,大可以颠倒以往的下笔顺序,画图时先画细节,这样无论你画得有多像,小歌都有很大概率识别不出。


上一篇:为什么我要费尽心思造出一个不完美的绘画机器人?
下一篇:中国AI企业融资总额占全球70% 巨大的繁荣背后到底隐藏了什么
精选推荐
这些人型机器人是如此真实,你的肉眼几乎无法区分
这些人型机器人是如此真实,你的肉眼几乎无法区分

[2017-09-03]   我们生活在一个区分现实与幻想变得越来越困难的世界。由于机器人技术的进步,创造人工的人类正在逐渐接近完美的最终目标。我们现在看到的机器人不再只是一块发光二极管,......

亚马逊计划建一个4000万美元的机器人中心
亚马逊计划建一个4000万美元的机器人中心

[2019-11-07]  爱吧机器人网消息,亚马逊11月6日宣布了一项计划,计划在美国马萨诸塞州韦斯特伯勒建立一个4000万美元、35万平方英尺的机器人创新中心。新 ...

国外眼科手术机器人为视网膜静脉阻塞患者带来希望
国外眼科手术机器人为视网膜静脉阻塞患者带来希望

[2017-03-20]  视网膜静脉阻塞,简称RVO,对患者来说是一种严重的疾病。该病病因为视网膜静脉中存在血液凝块,这可能导致视力严重下降,在某些情况下,病 ...

一个让深度学习惨败的通用人工智能领域——语境处理
一个让深度学习惨败的通用人工智能领域——语境处理

[2019-11-04]  Context是指用来解释一段给定文本或语句的来源框架,我们可以翻译为上下文或语境。维基百科将context定义为:*在符号学、语言学、社会学和 ...

揭秘达芬奇手术机器人
揭秘达芬奇手术机器人

[2018-04-19]  达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局(FDA)于2000年通过该标准,旨在利用微创手段 ...

比利时研发出可以自我愈合伤口的软体机器人
比利时研发出可以自我愈合伤口的软体机器人

[2017-09-03]  软体机器人是机器人技术的新兴领域; 他们“可以与人类相互作用,而不会杀死他们,并拿起像西红柿这样柔软的物体。” 从长远来看,布鲁塞尔大学队伍正在努力创建一个类似的材......

苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展
苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展

[2017-12-11]  苹果隐秘的自动驾驶汽车项目多年来一直在转移焦点,但今年似乎正在加速。 4月份,公司获得了在加利福尼亚州进行自动驾驶汽车测试的许可证,而在6月份,苹果公司首席执行官库......

新型轻便机器人套装重5kg,辅助跑步和步行
新型轻便机器人套装重5kg,辅助跑步和步行

[2019-10-23]  虽然步行对大多数人来说似乎不是负担,但对有些人来说,这项简单的运动往往会让人感到筋疲力尽。比如手术或中风后恢复的患者、帕金森氏症患 ...

本周栏目热点

创新推动以机器人为代表的智能装备制造业发展

[1970-01-01]    目前,中国已有机器人生产企业100多家,国内包括天津、重庆、上海、江苏以及广州等地,在当地政府部门的强力支持下都在大力发展自动装 ...

Jeff Dean:谷歌翻译API才9月就已获利

[2017-09-30]  很多人看来,人工智能一直都是停滞不前的,虽然研发出来的成果不少,但是接近现实,真正投放入现实的,却为数不多,不过在2016年9月,谷歌 ...

【专访】佛山需稳扎机器人等市场 期待更多本土跨国公司

[2015-12-10]     佛山处在改革开放前沿,此次跨国调研活动动作快,一定会引起全国关注。12月 ...

[1970-01-01]    机器和机器人把人从繁重的体力劳动和枯燥的工作中解放出来,去干更重要的工作,或者让人成为监工,监督机器人干活。这是一个美好的前景 ...

[2016-09-03]   60年多前的夏天,麻省理工学院里的几个计算机系的教授聚在一起,第一次提到了人工智能这个词。当时他们以为,用一个夏天的时间,就可 ...