爱吧机器人网 » 技术 > 大数据 > 正文

论“万能”的大数据及由此带来的诸多问题

大数据”——如果你反感这一用语的话,你并不是唯一有这种想法的人,但我认为我们如今已经接受了它——最激动人心的一个前景是,规模日益庞大的数据搜集活动,借助于现代化的数据处理和模式识别算法,将让我们对周围这个世界具有更为全面的认识,尤其是对人类行为。不幸的是,这同样也是大数据最令人担心的地方。

目前,大数据和隐私似乎是一对不共戴天的死敌。个人数据可以降低汽车保险支出,但代价是你的个人隐私。它可以提供至关重要的公共卫生数据——通过获取敏感且私密的个人健康信息。它可以帮助警察追踪犯罪分子——通过一种在实践中被认为遭到滥用的技术,创建面部识别“圆形监狱”(panopticon)。它可以根据你发布到网上的所有照片,对你的个人特征做出一个详细描述——即便你根本不希望这一切发生。

这些并不是仅仅是纯粹理论层面的担忧。据《纽约时报》报道:

由于政府机构监管不力,数十年来数据挖掘公司、数据代理公司、数据中间商数不断危害公民隐私,如今他们又将隐秘的个人数据分类带到一个全新的水平。他们已经制作了性侵受害者名单以及性病患者的名单。此外,还有阿尔茨海默氏并痴呆症及艾滋病患者的名单,阳痿和抑郁症患者名单。

与此同时,还有“冲动型买家”名单;“易受骗者”名单:即容易上当受骗的消费者,研究发现这个人群易于遭受“基于弱点的营销宣传”的影响。

可以想见,如果这种名单是来自于那些无意中显露出他们易受数据披露影响的人,这会带来什么样的严重后果。例如,通过算法可解读的Facebook帖子,再对比发帖者其他所有信息,可以作为他们本不想披露的秘密的证据。

大数据

这基本上存在两个问题。一是数据的匿名化和安全性没有任何一个标准。有些搜集和发布数据的机构会对数据进行匿名化处理,确保它们的安全,但这些举动让人感觉更像是权宜之计,“经过匿名化处理”的数据极少。例如,今年早些时候纽约出租车数据就未经过妥善的匿名化处理。

还有一个更深层、也更为重要的问题:人们是否有权知道他们的数据何时被别人搜集?一旦发生这种状况,是个人还是搜集方拥有这些数据?下面,我就来介绍一下麻省理工学院教授阿莱克斯·彭特兰(Alex Pentland)及其提出的“数据新政”(New Deal on Data):

从整体上讲,我们现在拥有的数据可以帮助减少环境污染,帮助创建透明政府,帮助应对流行疾病,当然也有助于提高工人的工作效率,让顾客获得更好的服务。但很显然,有人或有公司可以滥用数据…“新政”可以让人们知道自己有哪些数据正在被搜集,进而可以选择加入或退出。想象一下,如果你的仪表板可以显示你的居室掌握了哪些信息,以及分享了哪些信息,你可以将它关闭或打开…透明是关键。正在搜集的有关你的数据能形成对你生活的相当全面的认识,我认为一些公司并未意识到“抓取所有数据”战略的成本非常高。

然而,从实际情况来看,这种“新政”预示着创新和监管之间漫长而令人悲伤的战斗故事将掀开一个新的篇章。我并不反对后者(即监管),但相对于前者(即创新)的快速演变,我只是对它的表现经常感到失望罢了。毋庸置疑,数据搜集能力的指数级增长可以给我们带来巨大的好处,但同样不容置疑的是,所有人都极为担心科技对隐私发起的那场不可阻挡(几乎出于偶然)的战争,我们正面临着一场灾难,或者说距离大声疾呼更严格的监管只有一步之遥。

若想解决这个问题,科技行业理应从一开始就走到最前面,定义和执行对数据进行匿名化处理的技术标准。(如果这真的成为一个新的子行业,我丝毫不会感到吃惊。)但一个更好的结果是,大公司在一个性质相当于“新政”的自愿协议上达成一致,希望可以预先阻止民众呼吁加强监管的行动,而且宜早不宜迟。我认为科技行业并未充分意识到数据隐私和缺乏隐私对公众的危害。如果我们不认真对待这件事,那无异于是在玩火。


上一篇:大数据将改变企业和旅客的游戏规则吗?
下一篇:外媒全面深度分析大数据的革命
精选推荐
人工智能民主化能否实现取决于科技巨头
人工智能民主化能否实现取决于科技巨头

[2017-12-29]  我们经常听到像谷歌和微软这样的公司说他们希望人工智能民主化。这是一个很好的词,民主化。 但这些公司如何界定“民主化”还不清楚,像AI本身一样,它似乎有点炒作的味道...

这个外科手术机器人可以为患者“量身定制”
这个外科手术机器人可以为患者“量身定制”

[2019-07-12]  世界首创,来自澳大利亚机器人视觉研究中心的研究人员正在推动手术机器人的发展边界,他们创造了可定制的、小型化的手术机器人,能够唯一地 ...

7种常见的机器人焊接类型
7种常见的机器人焊接类型

[2017-12-17]  机器人焊接是工业领域最常见的机器人应用之一,近几十年来主要由汽车行业驱动。机器人焊接在完成大批量,重复性的焊接任务时效率最高。...

哈佛大学《自然》发表新驱动技术,让飞行机器人悬停且不受损伤
哈佛大学《自然》发表新驱动技术,让飞行机器人悬停且不受损伤

[2019-11-06]  哈佛大学研究人员发表在《自然》杂志上的一项最新研究,他们开发了一种由柔软的人造肌肉驱动的机器人蜜蜂(RoboBee),这种机器人在撞墙、 ...

麻省理工正研究植物机器人 让植物自主控制机器人
麻省理工正研究植物机器人 让植物自主控制机器人

[2018-12-08]  控制论通常指人类用机器人部件增强自己。我们听说过动物机器人或昆虫机器人,但我们很少听说植物机器人对吧?一个机器人其实是对植物有很大益处的,因为一般植物根本无法移动......

[2018-01-26]  纽约时报的报道,德国的研究人员已经开发出一种长约七分之一英寸的机器人,首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路,跳跃,爬行,滚动和游泳。它甚至爬出......

英国首台月球车是个小型四腿机器人 将于2021年登月
英国首台月球车是个小型四腿机器人 将于2021年登月

[2019-10-12]  探测器将用四条腿探测月球表面,并将数据传回着陆器,后者将把数据传回地球图 詹姆斯温斯皮尔英国即将成为继美国、俄罗斯、中国之后的又一 ...

2022年全球工业机器人市场将达到790亿美元
2022年全球工业机器人市场将达到790亿美元

[2017-09-04]  预计到 2022年, 全球工业机器人市场将达到790亿美元, 并在预测期内登记11 5% 的复合年增长率。随着发展中国家中小型企业需求的不断增长, 采用自动化技术以确保生产质量......

本周栏目热点

[1970-01-01]   这可能是未来最具发展潜力的职业之一,我们从职场角度为你解读如何成为 大数据 工程师,以及它的职业发展 ...

从Facebook社交媒体情绪实验看大数据道德困境

[1970-01-01]   今年曝光的Facebook私自进行社交媒体用户情绪实验的新闻引起了不小的争议,这把很多数据实验卷入到社会 ...

大数据时代的美国隐私权保护制度

[1970-01-01]   2014年5月,美国总统执行办公室(Executive Office of the President)发布2014年全球大数据白皮书 ...

那些年,曾经被我们误读的大数据

[1970-01-01]   如今,业界和学术界一直在热议大数据,不管是学术圈还是IT圈,只要能谈论点儿大数据就显得很高大上。然 ...

未来农业将在田里处理大数据

[1970-01-01]   基普·汤姆(Kip Tom)是第7代家庭农场主,他的农场种植的主要农作物是玉米和大豆,他同时也在进行玉 ...