爱吧机器人网 » 技术 > 模式识别 > 正文

陶大程:最快一年机器人将实现人脸识别

  人工智能及 机器人 离现实生活越来越近了,这从人才的流向便可窥探一二。仅在2016年,就有数名知名的学界学者接二连三加盟业界,如李飞飞、Ruslan Salakhutdinov、Yoshua Bengio等。学界与业界的密切合作,将对人工智能和机器人的产品商业化落地有极大帮助,同时企业界 应用 数据的积累也将推进学界技术探索的进程。

  对于学界与业界双向合作,世界顶尖的人工智能研究者、悉尼大学教授陶大程持肯定态度。值得注意的是,陶大程所从事的计算机视觉、机器学习研究正推动着人工智能及机器人的发展。不断突破的研究成果使他获得了澳大利亚科学最高荣誉尤里卡奖等权威奖项,并当选IEEEFellow和欧洲科学院院士。从人脸识别到多角度学习,从人工智能及机器人的商业化到对技术奇点的看法,在陶大程的讲述中,人工智能及机器人的发展状况被勾勒得更加清晰。

   “最快一年,人脸识别就能在机器人身上得以体现”

  在人工智能诸多领域中,普通人可能有感性认识的就是人脸识别领域,而各大科技公司近年来纷纷组建人脸识别小组,并以此为切入点布局人工智能。人脸识别,恰恰是陶大程研究多年、屡获国际大赛奖项,并实现了突破的主要研究方向。

  人脸识别是帮助机器人识别人类,从而进阶人机交互、协同合作的一个开始。陶大程提到,一方面,人形机器人可通过人脸识别使其更好地与人交互、融入家庭,另一方面则可以通过集成人脸识别功能用于人员搜索。

\

  不过,人脸识别技术仍然存在着不小的挑战。“最大的困境在于人脸识别算法本身的鲁棒性不足”。即当前较死板的算法缺乏灵活性及想象推理的能力,且对外部如光照、遮挡等因素变化的应对能力不足。机器人人脸识别面临的挑战还更为独特,如运动状态导致人脸细纹丢失以及对实时性更高的要求。

  陶大程团队的研究实现了突破,他们通过测量5个在不同环境中变化极小的“突出而稳定”的面部特征点来进行人脸识别。结果显示无论你做出悲伤或快乐的表情,还是室内或室外不同拍摄环境而造成光线的不同,这五个点都能保持较高的稳定性。这有助于提高人脸识别的鲁棒性。

  针对机器人,陶大程团队则提出了基于CNN的模糊不变特征学习方法,很好地解决了图像模糊对人脸识别的影响;同时,他们提出了主干分支集成网络的人脸识别模型,在提高了对姿态变化鲁棒性的同时,还有效保证了识别算法的实时性。

  应用这些技术,陶大程团队在2016PaSC的人脸识别比赛中以绝对的优势获得了第一名。根据比赛组织者的评估,他们的算法达到了和人类视觉系统一致的性能。

  “机器视觉发展已经历多年时间,人脸识别的发展时间最长”,而深度学习的应用,使得人脸识别的识别率从过去的20%-50%提高到了90%以上。技术的不断提升并部分达到实用水平展现出了巨大的市场前景,这是国内外众多科技公司选择人脸识别作为主攻方向的一个重要原因。

  “人脸识别很可能仅需一年就能够在机器人身上得以体现”,陶大程如是说。

  人脸识别还只是第一步,让机器更智能,更好地识别人类并且发展到能学习、模仿和创造,还需要做很多努力,这就包括多视觉学习、人体姿态估计、行为分析等。人体姿态估计能够帮助机器人在家庭中感知人的行为,而行为分析则结合了场景,能帮助机器从 视频 中识别出一个人的行为或者多个人一起参与的行为,例如一个人在游泳,多个人在踢足球。通过多角度学习,机器人能够愈发精准地理解一个事物、一个事件。

  陶大程的团队在这些计算机视觉和机器学习等领域的研究都实现了突破,并在权威期刊如IEEETPAMI、TIP等发表了研究成果。在2016 Activity Net竞赛中,陶大程团队取得了行为检测任务第一、行为识别任务第二的佳绩。

   人工智能及机器人商业化大势所趋但“基础很重要”

  当技术趋于成熟,商业化也随之而来。在学界人才像业界流入的驱使之下,各大科技公司的人工智能进展和未来布局让商业化进程处于加速状态。

  “人工智能的商业化是大势所趋。”他认为,当一项技术已经达到成熟阶段,那么它的商业化前景将非常可观。但人工智能商业化也面临着诸多挑战,技术不成熟、人工智能发展所造成的失业率反向抑制人工智能发展以及商业模式,这些都是可能影响的因素。

  “一个良性的商业化模式至少是稳扎稳打的,企业的产品开发是基于成熟的、自主研发的核心技术”,他建议,针对尚未解决的应用问题,不能盲目采用学术界公开的技术,而是需要培养自己的科研团队,主打独立自主研发这张牌。

   “总而言之,基础很重要。”

   智能机器人 、无人驾驶、民用无人机、人脸识别、智能语音……这些具备商业化的人工智能技术在他看来都是不错的商业化对象。

  技术奇点不可能实现不必恐慌人工智能威胁论

  在近期热播的美剧《西部世界》中,未来世界中外表与人无异的机器人产生了自我意识,甚至反过来操控人类,这也引发了许多人对于人工智能和机器人利弊的新一轮热议。在此之前,不少学者和知名人士,如霍金、比尔盖茨等也曾表达过对于人工智能发展的警惕。

  “技术奇点是不可能实现的,”陶大程认为。

  他提到,霍金等人的想法源自于技术奇点,即机器智能开始跨越式发展的时间点,同时也是一个更为智能的新型物种开始统治地球的起点。但在陶大程看来,任何事物的应用都有好有坏,“人工智能技术是一把双刃剑,关键在与如何合理的使用它”。

  “在未来,科技与人文一定是交互发展的。”陶大程认为,人工智能不会在失控的情况下肆意发展,因此大众不必恐慌,而作为技术及行业从业人员,“我们要遵循健康的发展之道”。

  实际上,目前人工智能仍处于弱人工智能阶段,距离大众口中的概念还有很长的一段路要走。在硬件方面,人工智能还需要更强大的感知器、更流畅稳定的机械系统、以及更高效的计算系统,来实现机器的智能分析能力;在软件方面,不仅需要一个通用型很高的系统设计框架,针对每个子模块,还需要高效的算法设计以及充实的理论验证。

  “我们从事人工智能方面的研究和发展工作,都是为了利用计算机来改善我们的生活”,这正是包括陶大程在内的诸多学者进行研究的初衷。




上一篇:机器视觉的下一个想象空间是嵌入式?
下一篇:人脸识别锁pk指纹锁,谁更胜一筹?
精选推荐
CES 2018:英特尔推出49量子位芯片争夺量子霸权
CES 2018:英特尔推出49量子位芯片争夺量子霸权

[2018-01-10]  在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中,英特尔通过了一个关键的里程碑。近日,这个科技巨头已经推出了一个49个量子位 ...

农业将为高科技行业 农业机器人的应用领域
农业将为高科技行业 农业机器人的应用领域

[2017-12-17]  农业正在迅速成为一个令人兴奋的高科技产业,吸引了新专业人士,新公司和新投资者。技术发展迅速,不仅提高了农民的生产能力,而且促进了我们所知道的机器人和自动化技术的发展。...

美国Natilus公司试飞水上无人货机 设计简单成本降低
美国Natilus公司试飞水上无人货机 设计简单成本降低

[2017-12-28]  Natilus创业公司成立于2014年,其梦想是建造大型无人机,以半价提供比船舶快得多国际货运。在十二月份,Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

这些人型机器人是如此真实,你的肉眼几乎无法区分
这些人型机器人是如此真实,你的肉眼几乎无法区分

[2017-09-03]   我们生活在一个区分现实与幻想变得越来越困难的世界。由于机器人技术的进步,创造人工的人类正在逐渐接近完美的最终目标。我们现在看到的机器人不再只是一块发光二极管,......

英国首台月球车是个小型四腿机器人 将于2021年登月
英国首台月球车是个小型四腿机器人 将于2021年登月

[2019-10-12]  探测器将用四条腿探测月球表面,并将数据传回着陆器,后者将把数据传回地球图 詹姆斯温斯皮尔英国即将成为继美国、俄罗斯、中国之后的又一 ...

瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作
瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作

[2019-07-12]  EPFL(瑞士联邦理工学院)的研究人员受到了蚂蚁的启发,开发了一款仅有10克重的小型机器人:他们可以相互交流,分配角色并完成复杂的任务。 ...

美国人工智能公司Skymind进入福建全面开展业务
美国人工智能公司Skymind进入福建全面开展业务

[2017-12-11]  人工智能在当今这个时代对大家来说想必是非常熟悉的,这也是我国近十几年来一直追求的目标,未来的时间里这也将是全人类追求的目标。就目前来看,近年来,人工智能或在我国迎......

谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算
谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算

[2019-10-23]  谷歌坚称自己已经取得了量子霸权——这标志着计算研究领域的一个重要里程碑。谷歌首次发布声明是在今年9月,虽然遭到竞争对手的质疑,但就 ...

本周栏目热点

生物识别技术那么多,为啥偏偏“刷脸”火了

[1970-01-01]   你走到一家自助银行前,摄像头通过刷脸,自动识别你的身份为你开门;你站到ATM机前输入密码,再在摄像 ...

NEC人脸识别技术致力服务公共安全

[1970-01-01]   沸沸扬扬的哈尔滨看守所杀警越狱事件随着最后一名案犯的落网而尘埃落定,但是围绕这起案件的深度讨论却 ...

从原理入手,解析基于DSP的汉字语音识别系统的实现方式

[1970-01-01]   语音识别是机器通过识别和理解过程把语音信号转变为相应的文本文件或命令的高技术。作为专门的研究领域 ...

谷歌为何力推虹膜技术 分析其背后的价值链条-模式识别

[2015-12-11]   指纹识别、人脸识别技术正在趋于成熟,也正在被应用到更丰富的场景,逐渐改变我们生活的方方面面。但在 ...

在移动互联网上,图像识别Face++可以做什么?

[1970-01-01]   在互联网上,没人知道你是一条狗。这是1993年《纽约客》杂志关于互联网匿名性的经典论述。时光荏苒,二 ...