爱吧机器人网 » 技术 > 大数据 > 正文

大数据是不是泡沫?

提要:目前大数据的火热程度可见不一般,大数据真的创造如此高的价值吗?或者说创造价值的范围有那么广吗?以置于在很多三线城市的运营商都在做大数据项目。实践经验中发现,实际投入成本远远大于其中收益。还是说有非直观的,隐性的价值?

如果是泡沫,还能持续多久,破灭后会是一翻什么行业景象?

来自知乎网友何明璐的解答:

这个问题要分布对待,里面有泡沫,但是也有实实在在取得业务价值的案例。那这个问题如何来诊断和分析。

我们看到,对于大数据这个概念没有出来之前,其实对于大型电商平台,电信运营商,包括大的金融行业已经在做类似大数据方面的事情,以解决海量异构数据下的实时性问题。这些都有明确的业务场景驱动,用传统的一些技术解决起来困难,针对这些有明确业务场景驱动的项目本身并没有太多的泡沫。可以看到的是大型的电商平台,运营商或金融机构立项或研究做的,解决内部大数据场景下问题的的项目,基本还是有实际的业务参考价值。

大数据泡沫

还有一种就是完全是迎合大数据概念的,本身就不存在需要大数据的业务场景,由于大数据炒的火热,原来存在的各种应用都冠以大数据的名头。但是当仔细分析后发现一个是本身不存在大数据标准的业务场景,一个是我们提出的目标本身就是虚拟的并不是真实客户需要的目标。对于这类项目存在极大的泡沫。

来自VC Kevin Sure的回答:

有一定泡沫.

Michael Jordan

Michael Jordan(不是打篮球那个)的答案

先说说他讨论这个问题的资格。作为IEEE fellow,伯克利的Jordan教授是机器学习世界范围内最被尊敬的专家之一,在2013年还被邀请在美国国家研究委员会对相关领域的报告里作序总结。

这里有全文:Machine-Learning Maestro Michael Jordan on the Delusions of Big Data and Other Huge Engineering Efforts

他观点的骨架:

1. 目前的大数据给出的结果可靠性太低,如果急于应用到实际中,就好比是土木工程都没学好就开始造桥,结果只能造出“豆腐渣工程”。

  • 一大波“false positive”(假阳性)正在接近,因为数据增长的速度不够支撑我们把大数据到处乱用的欲望
  • 作为一个科学,不够严谨(原文是“没有error bar”)。不像造桥的土木工程,经过多年的积累,明确地能告诉我们什么样的情况可以造,什么不可以。而大数据没有。

2. 目前在computer vision领域进展还很小

  • 只能在非常有限的范围内识别,比如人脸识别这样非常具体的引用(虽然这个不是直接说大数据,但是可以看出,作者认为真正做到万物都sensor还很远,大数据的采集能力终究还是有限的)

3. neural network根本和人脑的neural network不是一回儿事,我们对大脑的理解根本没到可以引用到计算机科学的程度

  • 现在deep learning所采用的back propagation技巧,明显不是大脑的运作方式
  • network的结构都完全不同,什么对数据的模糊性处理已经达到人脑的境界云云,主要是媒体扯谈

对他观点的总结:

有些媒体为了让公众容易理解打了些比方,但是这种比方造成了太多误解,进而造成了太多hype(夸张的大肆宣传)。大数据还是一个没有足够严谨程度的科学,可能有一定的概率做出一些有用的预测,但是使用不当,过分过早地依赖,则会造成灾难性的后果。

很多时候大家过早对一个技术爆发热情,寄希望她可以改变世界,如果短时间没有成果,有可能热情一下子转冷又觉得这是个错误,加速抽离给这个技术的资源。显然Michael很担心现在公众对这个技术的热情,并不是基于对这个技术的理解,从而有可能会经历这样的态度转变。但是他认为这个领域是现实存在的,很多重要的应用,假以时日,是会创造价值的。但是现在很多媒体宣传,甚至投资行为,都是泡沫。

最后他觉得,如果他有10亿美元,一定会投入到natural language processing里面去。毕竟这是人机互动很重要的一个方面。


上一篇:Hadoop大数据可以帮助医疗机构5种方法
下一篇:大数据时代的美国隐私权保护制度
精选推荐
可编辑神经网络,有望简化深度学习?
可编辑神经网络,有望简化深度学习?

[2019-10-04]  深度学习是一个计算繁重的过程。 降低成本一直是 Data curation 的一大挑战。 关于深度学习神经网络大功耗的训练过程,已经有研究人员 ...

机器人灵巧手将成为智能机器人的下一个重大突破
机器人灵巧手将成为智能机器人的下一个重大突破

[2018-01-25]  计算机科学教授兼东北地区助手机器人实验室负责人罗伯特·普拉特(Robert Platt)说:“机器人手操作是下一步要解决的问题。想象一下,一个机器人可以在现实世界中用手去做事......

2017年:AI渗入云端
2017年:AI渗入云端

[2017-12-29]  云中的人工智能不仅仅是科技巨头的权力游戏,它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

人工智能民主化能否实现取决于科技巨头
人工智能民主化能否实现取决于科技巨头

[2017-12-29]  我们经常听到像谷歌和微软这样的公司说他们希望人工智能民主化。这是一个很好的词,民主化。 但这些公司如何界定“民主化”还不清楚,像AI本身一样,它似乎有点炒作的味道...

这些人型机器人是如此真实,你的肉眼几乎无法区分
这些人型机器人是如此真实,你的肉眼几乎无法区分

[2017-09-03]   我们生活在一个区分现实与幻想变得越来越困难的世界。由于机器人技术的进步,创造人工的人类正在逐渐接近完美的最终目标。我们现在看到的机器人不再只是一块发光二极管,......

为未来战场创造更有效的机器人 美国陆军研究人工纳米马达
为未来战场创造更有效的机器人 美国陆军研究人工纳米马达

[2019-10-11]  为了使机器人在战斗中更有效、更多才多艺地成为士兵的战友,美国陆军研究人员正在执行一项任务,即研究肌肉分子生命功能的价值,以及复制过 ...

亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人(巨型机甲)
亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人(巨型机甲)

[2017-03-21]  近日,亚马逊CEO杰夫·贝佐斯实现了每一个6岁儿童都会有的梦想,他控制了一个巨大的机甲机器人。据国外媒体Verge报道,前天(3月19日),贝 ...

研究人员融合人类与AI的创造力 显著提高了深度学习的表现
研究人员融合人类与AI的创造力 显著提高了深度学习的表现

[2019-10-12]  由加拿大人工智能领域研究主席、滑铁卢大学系统设计工程教授Alexander Wong领导的一个团队开发了一种新型紧凑型神经网络家族,可以在智能 ...

本周栏目热点

做为一名大数据新手 应该通过这篇文章了解大数据

[2018-07-23]  一、大数据是什么?大数据,big data,《大数据》一书对大数据这么定义,大数据是指不能用随机分析法(抽样调查)这样捷径,而采用所有数据进 ...

BAT大数据野心:数据生产全链条浮现

[2016-07-12]   本报记者 周慧 北京报道导读以BAT为代表的中国 互联网 企业,在数据领域各有千秋,百度的搜索数据、阿里的电商数据、腾讯的社交数 ...

为什么说发展大数据是有道理的

[1970-01-01]   近日,习主席考察贵州时提到:贵州发展大数据确实有道理。那么为什么说发展大数据是有道理的?从历史的 ...

《时代周刊》:用形象化的老办法对付大数据

[1970-01-01]   《时代周刊》最新一期封面文章称,我们每天被数据海洋淹没,只有让冷冰冰的数据形象化,变成看得见摸得 ...

从Facebook社交媒体情绪实验看大数据道德困境

[1970-01-01]   今年曝光的Facebook私自进行社交媒体用户情绪实验的新闻引起了不小的争议,这把很多数据实验卷入到社会 ...