爱吧机器人网 » 专题 > 相关科技 > 正文

给机器一双“慧眼”看懂这个世界

  7月11日,专注于计算机视觉和深度学习的AI企业商汤科技宣布完成4.1亿美元B轮融资,创下全球人工智能领域单轮融资最高纪录,这条新闻引爆了行业热点。商汤科技凭借着“计算机视觉”这一黑科技获得巨额融资,那么什么是计算机视觉呢?
 
  近年来,为了让机器更像人,能够认知事物,从而进行判定和深度学习,计算机视觉技术方法与 应用 发展迅速。计算机视觉研究如何让计算机可以像人类一样去理解 图片 、 视频 等多媒体资源内容。例如用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等,并进一步处理成更适合人眼观察或进行仪器检测的图像。近些年在海量的图像数据集、机器学习(深度学习)方法以及性能日益提升的计算机支持下,计算机视觉领域的技术与应用均得到迅速发展。
 
  当下机器视觉技术已经渗入到我们的日常生活中,从手机里的美颜APP面目识别功能、人脸相册分类,到支付宝面部识别身份验证、储物柜人脸识别,以及 工业机器人 对物体准确抓取、物流 机器人 障碍避让等等都是运用了计算机视觉技术。
 
  国内外众多知名机构在计算机视觉不同方向均有涉及,国内更是涌现出一批相关的明星创业团队。除了耳熟能详的Google、微软、Facebook等工业界科技巨头有所涉及之外,一些着名高校也设有专门的实验室,如斯坦福、麻省理工以及伯克利等。国内则涌现出一批以依图、商汤、旷视、云从以及格灵深瞳等为首的创业公司,技术团队核心成员大多拥有前述工业界及学术界知名机构的研究经验。
给机器一双“慧眼”看懂这个世界
 
  下面就详细梳理一下计算机视觉的应用领域:
 
  人脸识别
 
  “人脸识别”是人工智能“计算机视觉”领域中最热门的应用,今年 2 月,《麻省理工科技评论》发布“2017 全球十大突破性技术”榜单,来自中国的技术“刷脸支付”位列其中,今后靠脸吃饭完全不是问题。这是该榜单创建 16 年来首个来自中国的技术突破。人脸识别技术目前已经广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗等行业。据业内人士分析,我国的人脸识别产业的需求旺盛,需求推动导致企业敢于投入资金。目前,该技术已具备大规模商用的条件,未来三到五年将高速增长。而今年,这一技术有望在金融与安防领域迎来大爆发。
 
  视频监控分析
 
  人工智能技术可以对结构化的人、车、物等 视频 内容信息进行快速检索、查询。这项应用使得让公安系统在繁杂的监控视频中搜寻到罪犯的有了可能。在大量人群流动的交通枢纽,该技术也被广泛用于人群分析、防控预警等。
 
  视频监控领域盈利空间广阔,商业模式多种多样,既可以提供行业整体解决方案,也可以销售集成硬件设备。将技术应用于视频及监控领域在人工智能公司中正在形成一种趋势,这项技术应用将率先在安防、交通甚至零售等行业掀起应用热潮。
 
  工业视觉检测
 
  机器视觉可以快速获取大量信息,并进行自动处理。在自动化生产过程中,人们将机器视觉系统广泛地用于工况监视、成品检验和质量控制等领域。
 
  机器视觉系统的特点是提高生产的柔性和自动化程度。运用在一些危险工作环境或人工视觉难以满足要求的场合;此外,在大批量工业生产过程中,机器视觉检测可以大大提高生产效率和生产的自动化程度。
 
  医疗影像诊断
 
  医疗数据中有超过 90% 的数据来自医疗影像。医疗影像领域拥有孕育深度学习的海量数据,医疗影像诊断可以辅助医生,提升医生的诊断的效率。
 
  2015 年 4 月,IBM 成立了 Watson Health 部门,开始进军医疗行业。2015 年 8 月 6 日,IBM 宣布以 10 亿美元的价格收购医疗影像公司 MergeHealthcare,并将其与新成立的 WatsonHealth 合并。2016 年 2 月,IBM 又斥资 26 亿美元收购医疗数据公司 TruvenHealthAnalytics。今年 2 月份,在 HIMSS17 大会上 Watson Health 公布了 IBM 的第一个认知影像产品 Watson Clinical Imaging Review,该产品可检查包括图像在内的医疗数据,帮助医疗服务提供商识别需要关注的最危急情况。
 
  文字识别
 
  计算机文字识别,俗称光学字符识别,它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。这是实现文字高速录入的一项关键技术。
 
  今年三月份,海康威视研究院预研团队基于深度学习技术的 OCR(Optical Character Recognition,图像中文字识别)技术,刷新了 ICDAR Robust Reading 竞赛数据集的全球最好成绩,并在「互联网图像文字」、「对焦自然场景文字」和「随拍自然场景文字」三项挑战的文字识别(Word Recognition)任务中取得第一。同期参赛的有来自 82 个国家的 2367 支队伍参加,其中包括 Google、微软、百度、三星、旷视等团队。
 
  如今“计算机视觉”成为了小风口,大量资本涌入,而 2017 年可能将是人脸识别产业应用产生突破性进展的一年。人脸识别和视频监控两大方向最受资本青睐,同时技术也在寻找其他方向的突破。

上一篇:VR、3D技术、智能机器人:新技术将给智能家居带来一场革命
下一篇:以植物为灵感 软体机器人能像葡萄藤一样延伸
精选推荐
Waymo:人性和行为心理学才是无人驾驶最大的挑战
Waymo:人性和行为心理学才是无人驾驶最大的挑战

[2019-11-03]  自动驾驶汽车作为AI领域内最大的挑战之一,谷歌致力于其研发已有十余载,现在他们逐渐意识到,最困难的是如何让人们享受驾驶的乐趣。这是一 ...

农业将为高科技行业 农业机器人的应用领域
农业将为高科技行业 农业机器人的应用领域

[2017-12-17]  农业正在迅速成为一个令人兴奋的高科技产业,吸引了新专业人士,新公司和新投资者。技术发展迅速,不仅提高了农民的生产能力,而且促进了我们所知道的机器人和自动化技术的发展。...

什么是机器人学?机器人学简介
什么是机器人学?机器人学简介

[2017-12-14]  机器人学是工程学与科学的交叉学科,包括机械工程,电气工程,计算机科学等。机器人技术涉及机器人的设计、制造、操作和应用,以及用于控制、感官反馈和信息处理的计算机系统。...

人工智能民主化能否实现取决于科技巨头
人工智能民主化能否实现取决于科技巨头

[2017-12-29]  我们经常听到像谷歌和微软这样的公司说他们希望人工智能民主化。这是一个很好的词,民主化。 但这些公司如何界定“民主化”还不清楚,像AI本身一样,它似乎有点炒作的味道...

谷歌在中国成立一个新的人工智能(AI)研究中心
谷歌在中国成立一个新的人工智能(AI)研究中心

[2017-12-13]  谷歌正在中国建立一个新的人工智能(AI)研究中心,希望进一步扩展到中国,以充分利用中国高度重视的人工智能技术。人工智能是目前地球上最具竞争力的领域之一,亚马逊,微软......

MIT用深度学习处理3D点云数据 应用于无人汽车等领域
MIT用深度学习处理3D点云数据 应用于无人汽车等领域

[2019-10-23]  如果你见过自动驾驶汽车,也许会对车顶上那个一直在旋转的圆柱体感到好奇。这是一个雷达传感器,无人驾驶汽车依靠它在现实世界中进行导航。 ...

Crossbar将电阻式RAM推入嵌入式AI
Crossbar将电阻式RAM推入嵌入式AI

[2018-05-17]  电阻RAM技术开发商Crossbar表示,它已与航空航天芯片制造商Microsemi达成协议,允许后者在未来的芯片中嵌入Crossbar的非易失性存储器。此举是在先进制造业节点的领先代工厂选......

谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算
谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算

[2019-10-23]  谷歌坚称自己已经取得了量子霸权——这标志着计算研究领域的一个重要里程碑。谷歌首次发布声明是在今年9月,虽然遭到竞争对手的质疑,但就 ...

本周栏目热点

英伟达宣布开源物理仿真引擎 PhysX

[2018-12-12]  物理仿真引擎的作用,是让虚拟世界中的物体运动符合真实世界的物理定律,经常用于游戏领域,以便让画面看起来更富有真实感。PhysX 是由英伟达提出的物理仿真引擎,其物理模拟......

外媒Cnet总结了家务机器人未来的发展方向

[1970-01-01]    随着科技的发展,简单的机器人已经来到我们的生活中,比如机器人型真空吸尘器或是具有一定人工智能的沟通型家庭机器人。但显然,与科幻 ...

英国研究人员达成有史以来最快的数据传输速率

[2016-02-18]   伦敦大学学院(UCL)的研究人员已经达成数字信息有史以来最快的数据传输速率。作为专注于研究光传输系 ...

10个动图看遍科技界的大新闻

[2016-01-04]   1 新视野号经过冥王星,发回重要照片和资料2 苹果发布了第一款可穿戴设备 Apple Watch3 微软发 ...

IBM转型认知计算重返消费市场 这事该如何理解?

[2016-01-14]   文|翔snowman(微信公众号:科技茱比莉Jubilee)这两天IBM再次成为焦点。先是一则严重失实的标题党文章 ...