爱吧机器人网 » 技术 > 模式识别 > 正文

这五种人工智能技术可以识别图片

很长一段时间以来,人工智能的研究都停留在文字层面,比如著名的图灵测试(Turning Test),证明了机器能够像人类一样智能地回答书面问题。

而如果让机器变得更聪明,仅仅处理文字显然是不够的。事实上,人类心智非常善于视觉处理。从所见当中识别图案、物体以及文本情景的能力让我们很智能,这种能力也是人的本质特征。

不过直到最近,计算机都对图片束手无策。比如,除非人为添加一些标签和注释,否则机器就无法理解图片,图片也就是成了无用的文件。

但是,这种尴尬的情况正在发生变化。一大批能看懂图片的人工智能技术已经来到人间,下面不妨来看看机器之心的盘点:

谷歌 TensorFlow

5月份谷歌推出 Google Photos时,媒体关注的焦点是:人工智能和图片搜索结合后所产生的强大功能。谷歌声称(并且用户也很快确认),搜寻特定某人,你会找到对方从现在到婴儿时期的照片。搜索品种名,你就能找到相应品种狗的照片。把名字和食品类别结合起来,比如输入「最大披萨」,就能锁定特定图片。

这五种人工智能技术可以识别图片

这款应用发布之初,媒体无从得知谷歌究竟研发了多长时间。不过,一些搜索功能在Google+上出现一年多了。

两周前,谷歌以TensorFlow平台形式开源了它的人工智能主体部分。

尽管TensorFlow并不是第一个开源人工智能平台,但是,它是与谷歌强大图片搜索关系最为密切一个。

开源TensorFlow意味着,包括初创公司在内的其他公司,能够利用谷歌的这个开源平台,快速将人工智能和图片结合起来。尽管谷歌并未开放人工智能关键技术,包括在众多服务器上运行的能力。谷歌也没有开放让其如此强大的用户数据库。但是,谷歌的此举毫无疑问将刺激整个机器学习和人工智能创业生态的发展。

我们也期待着基于TensorFlow的各种震撼新应用能于明年进入市常

Facebook Photo Magic

Facebook近期开始在Messenger应用上测试一项新功能——Facebook Photo Magic。这是一个可选应用,它会扫描手机相册照片并对它们进行面部识别处理。Photo Magic会识别照片中的人物(他们也是你的Facebook好友),建议你和他们一起分享这些照片。

这五种人工智能技术可以识别图片

毫无疑问,这项功能给Facebook带来了双重优势。首先,它鼓励用户更多在Messenger上分享。其次,它改善了识别。但是,仅仅这项便利功能是不够的,用户实际上可以赞成或拒绝在任意灯光条件、角度和其他参数条件下,Facebook使用人工智能对面部和名字进行匹配。Facebook人工智能掌握的照片越多,识别效果也越好。

令人吃惊的是,即使遮住了脸部,Facebook的「面部识别」一样能能识别出你的脸部。这个系统也关注发型、姿势、衣着和身材。(请注意,我们并不清楚Facebook是否已经实现了这种先进系统,但很明显的是,它从用户照片中收集数据。)

Facebook 的Photo Magic拓展了图片库来源,它不仅收集Facebook(社交网站),还收集Messenger(聊天应用)的数据,扩充了数据量。Photo Magic还鼓励赞成或否定匹配结果,提高数据质量。

很明显,Facebook最终目标是识别任意场景中的任何人,即使在看不清脸部的恶劣灯光条件下。毫无疑问,未来Facebook的人工智能会扫描和分析环境,发现可市场化的线索——比如,如果某人在照片里经常打棒球,广告商就可以利用这个信息锁定棒球迷,尽管他在上传照片的文字里并没有表露出这种兴趣。

毫无疑问,他们也打算通过观察图片中一起出现的人,进一步建立社交图谱。

微软牛津项目(Project Oxford)

微软日前也更新它的牛津项目,这是一个工具包,让开发者通过旗下的Azure云平台,使用微软的人工智能系统。

这个工具包支持人工智能各个方面的应用,包括口语,视频和其他媒体。但是,最震撼和最强大的功能莫过于牛津项目现在支持开发者通过牛津人脸应用平台接口项目( Project Oxford Face API)检测图片中的人物表情。

这五种人工智能技术可以识别图片

譬如,用牛津项目处理一张包含5个人的照片,识别照片中的脸以及每个人的表情——快乐,愤怒或恶心。

这项功能在新的高度,像人类一样「理解」图片质量。观看他人照片时,人们关注的最重要特征就是个人或群体的情感状况。

Pinterest Visual Search

Pinterest日前发布了全新的图片搜索功能,它能帮助用户发现更多的信息甚至帮助购买他们在固定照片里看到的产品。

这五种人工智能技术可以识别图片

首先,在 Pinterest的图片中选中任一物体(来回拖动一个盒状标识)。然后,搜索工具会找到具有相似图案和颜色的相似物,系统会将最匹配的结果链接到购买按钮上,点击这里就能购买该产品。

这个功能是以伯克利视觉和学习中心(Berkeley Vision and Learning Center)的深度学习人工智能为基础的。

这种照片人工智能应用可以说是万维网照片的雏形,在这个万维网中,每张图片中的每个物体都与等同物或者相似物、相关物彼此关联。

上一页12下一页

上一篇:第一页
下一篇:翻译全都要下岗!微软神级“原声”翻译软件震惊世界
精选推荐
如何让人工智能机器人快速自我纠正错误并吃一堑长一智?
如何让人工智能机器人快速自我纠正错误并吃一堑长一智?

[2017-08-23]  莱斯特大学数学系的研究人员在《Neural Networks》杂志上发表了一篇文章,概述了新算法的数学基础,可以使人工智能收集错误报告并立即纠正,而不影响现有技能 ,同时还会积......

2023年服务机器人市场将超过250亿美元
2023年服务机器人市场将超过250亿美元

[2017-09-04]  全球服务机器人市场预计到2023年将达到250亿美元, 并在预测期内登记15% 的复合年增长率。短期中期回收期和投资回报率高 (ROI), 以及在教育和研究、临场感、防御、救援和安......

从AI中窥探人性
从AI中窥探人性

[2018-01-03]  人们对人造智能的恐惧早已成为科幻书籍和电影的极好题材。但现在,一些同样的担忧开始影响关于现实世界AI技术的政策讨论。如果这样的担忧演变成为一种技术恐慌...

为未来战场创造更有效的机器人 美国陆军研究人工纳米马达
为未来战场创造更有效的机器人 美国陆军研究人工纳米马达

[2019-10-11]  为了使机器人在战斗中更有效、更多才多艺地成为士兵的战友,美国陆军研究人员正在执行一项任务,即研究肌肉分子生命功能的价值,以及复制过 ...

2017年:AI渗入云端
2017年:AI渗入云端

[2017-12-29]  云中的人工智能不仅仅是科技巨头的权力游戏,它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

17世纪的莱布尼茨试图制造“思想机器”却被现实打脸
17世纪的莱布尼茨试图制造“思想机器”却被现实打脸

[2019-11-05]  莱布尼茨,德国哲学家、数学家、律师,历史上少见的通才1666年,德国博学家戈特弗里德·威廉·莱布尼茨(Gottfried Wilhelm Leibniz)发 ...

[2018-01-26]  纽约时报的报道,德国的研究人员已经开发出一种长约七分之一英寸的机器人,首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路,跳跃,爬行,滚动和游泳。它甚至爬出......

智能农业:种地的事儿未来全交给这些机器人吧
智能农业:种地的事儿未来全交给这些机器人吧

[2019-12-07]  SRC公司创始人Sam与温波尔庄园农场经理Callum Weir以及监控机器人Tom总部位于英国的农业科技初创公司SRC(Small Robot Company),正在 ...

本周栏目热点

苹果公司收购Regaind人工智能初创公司

[2017-10-01]  要说新一代的iPhone有什么新的黑科技,那么就一定要说到配备在iPhone X身上的人脸识别技术了,可以说,这是目前iPhone的最新也是最为惹人 ...

Facebook信使测试语音转换文字功能

[1970-01-01]   Facebook正在测试一项新的功能,该功能是Facebook信使应用的部分功能,它可以自动将语音信息转换为文字 ...

人脸识别:离生活越来越近

[1970-01-01]   你来到家门口,不用再在包里翻来翻去找钥匙,对着门前的 人脸识别 系统刷脸确认身份,便可进门;在超市 ...

人机交互技术:2015指纹识别将大爆发

[1970-01-01]   各项关于人机交互的技术正在不断发展、日益成熟,明年 指纹识别 技术将得到大爆发。所谓指纹辨识,顾名思 ...

科大讯飞第一季营收1.7亿 中移动成单一大股东

[1970-01-01]   4月24日消息,科大讯飞(股票代码:002230)昨日发布公告,公告显示,科大讯飞2013年第一季度营收1 73 ...