爱吧机器人网 » 技术 > 大数据 > 正文

如何辨别“伪大数据”产品?

科技 营销紧跟正在上升的有力潮流来盈利,这是个长期公认的做法。在 互联网 热潮(.com boom)时期,和 互联网 一点儿关系没有的公司都在名字里加上了“.com”。环保产品满身绿色。云端产品都和“云”贴边。现在又兴起用 大数据 来贴金。

这些夸张的手段是否弊大于利呢?也许因为营销中利用了“ 大数据 ”这个词,人们能去接触并了解一个不然他们不会去考虑的产品。但这个伎俩几乎骗不了谁,并且会让用伪 大数据 技术的用户抓狂。

大数据 分析平台厂商Platfora引起了Luth Research调查 大数据 分析市场现状的兴趣。他们的调查问卷直接问回答者他们是否把小数据产品换了个包装说成是 大数据 产品;55%回答了是。大约一半的回答者称他们不得不把 大数据 分成小份来分析,并且小数据产品用在 大数据 上是不太成功的。Luth Research分析结论是:“不好用的 大数据 分析工具影响士气。对他们用的工具不满意的回答者更倾向于用压力大、令人沮丧、浪费时间这种词来形容他们的 大数据 分析体验。”

Platfora的创始人兼CEO Ben Werther说,如果一个公司把它本质不是 大数据 的产品定位成 大数据 ,那就是在自砸招牌。“今年早些时候,我为DataRPM写了些东西,DataRPM有非常好的产品,但自从我认识他们起,我就告诉他们, 大数据 不是描述他们的产品价值的正确用词。在最近的广告上我看见DataRPM用“ 大数据 公司”来描述他们自己。”

DataRPM通过 自然语言 ,自动创建面板及对数据进行语义建模来解决顶层漏斗形商业智能问题(“为何顶层漏斗形商业智能会引领新潮流”)。没受过训练的用户也可以尝试通过用 自然语言 问问题在DataRPM上试水。根据问题会生成新的面板。通过增加更多的语言,这个面板可以被细化。这样一来,用户可以找到他们并不知道的数据集。一般公司中,只有30%人接触到商业智能,通过利用DataRPM这样的产品,可以极大地提高这一比例。

但是这个和 大数据 有啥关系呢?也许勉强可以说DataRPM能从 大数据 库中进行查询吧。但是通过表单也可以做呀。表单是 大数据 技术么?一摞纸是 大数据 技术么?DataRPM为了和 大数据 贴边的做法反而掩盖了它真正的价值。

Qlik和Tableau和 大数据 公司都有很多合作并且经常被用来处理 大数据 ,但是他们的市场营销都看重他们的核心价值即辅助数据的探索和发现过程。Looker是这个领域的新秀,他们独特的探索发现方法已经有了一些活跃的初期用户,但是他们非要在产品介绍页面上写上一段他们的产品能“解开大型数据集的迷”。

说到底, 大数据 到底是啥意思呢?

Luth Research的报告验证了Werther的观点。回答者被问到了有关下面这些能力的问题:指定小时数/天数内的结果;不使用IT技术来添加数据源;迭代分析;获取数据源访问;不需要把数据分成小块;分享结果的简易程度;不使用IT来做分析;数据放在集中式数据库内;处理任何数量级的数据;自动实时的分析;能方便地加入新数据集;可视化的结论;分析不同种类的数据。

超过半数的 大数据 分析产品用户称他们有上述所有的能力。计划使用 大数据 产品的用户中有四分之一有上述的能力。注意上面和 大数据 有严密关联的只有几项而已——大多数不过是更好的商业智能技术罢了。

那么伪 大数据 技术究竟是什么呢?是并不能把大的数据集广泛让人们使用或不能帮助数据科学家有新突破的技术。就DataRPM来说,他们的技术也许是很不错的,但它并不是 大数据 技术。

那什么是真的 大数据 技术呢?是超赞的能够让人更容易地有意义地使用 大数据 。换句话说, 大数据 就是说一个东西很好并且能处理大量的数据。想要分辨真假 大数据 技术的话,当一个零售商向你推销他们的故事的时候,你可以问他这个技术是否能帮你爸妈使用 大数据 ,或者数据科学家是否能用它来做以前做不到的事。如果两样它都可以,那才可以被称作 大数据 技术。如果不能,但你认为该技术也不错,那就只能管它叫商业智能。


上一篇:十个有趣的“大数据”经典数据挖掘案例
下一篇:外媒评出2014年20大数据可视化工具及资料
精选推荐
揭秘达芬奇手术机器人
揭秘达芬奇手术机器人

[2018-04-19]  达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局(FDA)于2000年通过该标准,旨在利用微创手段 ...

麻省理工又秀神技:推出如魔法般跳跃的方块机器人集群
麻省理工又秀神技:推出如魔法般跳跃的方块机器人集群

[2019-10-31]  几天前,小编向大家介绍过麻省理工(MIT)研发的一种自组装机器人集群(点此阅览),它们可以用统一标准的小单元自动组装出各种大型结构。 ...

美国人工智能公司Skymind进入福建全面开展业务
美国人工智能公司Skymind进入福建全面开展业务

[2017-12-11]  人工智能在当今这个时代对大家来说想必是非常熟悉的,这也是我国近十几年来一直追求的目标,未来的时间里这也将是全人类追求的目标。就目前来看,近年来,人工智能或在我国迎......

麻省理工学院最新研究:优化软体机器人的控制和设计
麻省理工学院最新研究:优化软体机器人的控制和设计

[2019-11-24]  软体机器人属于一个新的领域,它可能在诸如外科手术等领域发挥重要作用(手术时的纳米机器人需要在人体内部移动而不损伤软组织)。软体机器 ...

2017年:AI渗入云端
2017年:AI渗入云端

[2017-12-29]  云中的人工智能不仅仅是科技巨头的权力游戏,它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

2018年企业数字化转型的五大趋势
2018年企业数字化转型的五大趋势

[2017-12-16]  据2016年哈佛商学院研究表明,选择进行数字化转型的企业在3年内表现出了55%的平均毛利润提升,相比之下其他企业毛利润同期降低了37%。数字化转型企业的领头羊,也曾是收入处于......

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私
英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14]  英伟达(Nvidia)和伦敦国王学院(King’s College London)的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络, ...

机器人工程师具体都做什么?
机器人工程师具体都做什么?

[2017-12-08]  机器人工程师是幕后设计师,负责创建机器人和机器人系统,能够执行人类无法完成或不愿意完成的任务。 通过他们的创造,机器人工程师帮助工作更安全,更轻松,更高效,特别是......

本周栏目热点

做为一名大数据新手 应该通过这篇文章了解大数据

[2018-07-23]  一、大数据是什么?大数据,big data,《大数据》一书对大数据这么定义,大数据是指不能用随机分析法(抽样调查)这样捷径,而采用所有数据进 ...

BAT大数据野心:数据生产全链条浮现

[2016-07-12]   本报记者 周慧 北京报道导读以BAT为代表的中国 互联网 企业,在数据领域各有千秋,百度的搜索数据、阿里的电商数据、腾讯的社交数 ...

为什么说发展大数据是有道理的

[1970-01-01]   近日,习主席考察贵州时提到:贵州发展大数据确实有道理。那么为什么说发展大数据是有道理的?从历史的 ...

《时代周刊》:用形象化的老办法对付大数据

[1970-01-01]   《时代周刊》最新一期封面文章称,我们每天被数据海洋淹没,只有让冷冰冰的数据形象化,变成看得见摸得 ...

从Facebook社交媒体情绪实验看大数据道德困境

[1970-01-01]   今年曝光的Facebook私自进行社交媒体用户情绪实验的新闻引起了不小的争议,这把很多数据实验卷入到社会 ...