爱吧机器人网 » 技术 > 大数据 > 正文

埃博拉病毒——大数据时代的疫情防控

2014年时代杂志的年度人物称号由埃博拉患者护理人员获得,在向他们致敬的同时,让我们回顾一下去年这场饱受关注并且持续到今年的全球性传染病事件。

2014年继马航客机失联事件之后,始发于西非几内亚的埃博拉病毒疫情经由传统媒体和数字媒体走入全球公众视野。据世界卫生组织提供的资料[1]显示,埃博拉病毒最早在1976年同时爆发的两起疫情中首次出现的,一起在苏丹,另一起在刚果民主共和国。后者发生在位于埃博拉河附近的一处村庄,该病由此得名。该次埃博拉疫情在刚果民主共和国爆发的是扎伊尔标准亚种,累计318人患病,280人死亡,致死率88%;在苏丹爆发的则是苏丹亚种,累计284人患病,151人死亡,致死率53%;另外还有雷斯顿、科特迪瓦、邦地布优等三个亚种,对动物和人类的危害相对温和。据悉,目前正在肆虐全球的埃博拉病毒,正是致死率最高的扎伊尔标准亚种。

埃博拉病毒疫情时隔几年便爆发一次,不过之前每次疫情规模都比较小,主要集中在一个地区爆发,并且局限在中非。特别地,刚果民众共和国史上曾多次爆发埃博拉疫情。

2014年3月开始爆发的埃博拉病毒疫情的爆发规模引起了国际社会的关注,并且被世界卫生组织列为“国际间关注的公共卫生紧急事件”(历史第三次)。首先,这次疫情涉及到了多个国家和地区。全境范围受影响的国家包括几内亚、利比里亚和塞拉利昂。部分领土受影响的地区包括马里的卡伊,西班牙的马德里,美国的达拉斯、德克萨斯州和纽约市,英国苏格兰地区的格拉斯哥市,尼日利亚的拉各斯哈科特港,以及塞内加尔的达喀尔。其次,这次埃博拉病毒疫情出现的病例和死亡数字超过了所有其它疫情的总和。截止2014年12月31号,累计20206人患病,7905人死亡[2]。并且数字还在不断增加。而所有的埃博拉护理者,则被美国时代周刊选为2014年的年度人物。

回望过去几十年,人类无疑在信息、科技、生物、医疗等领域取得了今非昔比的成果。反观2014年埃博拉病毒疫情的爆发、传播、媒体报导、控制,我们不禁开始思考在这个大数据时代,数据、统计、理性思考、批判思维能为人类对疫情防控带来什么好处?这篇文章试图从三个角度去阐述大数据如何与疫情防控紧密相连。本文第一部分讨论了如何通过交通数据、移动通信数据与社交媒体数据等非传统公共卫生数据来测算乃至预测疫情风险;第二部分重点关注死亡率的不同估算方法带来的对于疫情风险的不同认知;第三部分聚焦在埃博拉病毒疫情的治疗和防控支出数据。

一、数据驱动的疫情预测

1. 由交通数据预测疫情[3]

全球人口流动的日趋频繁使某区域爆发的疫情会给全球其他国家和地区带来潜在的疫情风险,于是如何对此类疫情风险进行有效的预测和评估自然就成了一个值得探究的课题。本次埃博拉爆发的一个重大特征即是,疫情通过交通运输突破国境,在源爆发地几内亚之外多国肆虐。对于国际间的人口流动,飞机显然是最主要的交通方式,因此对机场人口流动数据的统计分析也就成了重中之重。

事实上机场数据也早已被很多领域的研究者们所重视,基于此类数据分析建模的案例也已屡见不鲜。对于埃博拉疫情传播的分析,也有研究人员给出了他们的方法,其中一种就是通过估计引入风险(import risk)的方法来量化埃博拉对某一地区可能造成的影响。

对于引入风险的估计,最核心的问题便是如何通过动态模型或是统计模型将风险量化。这里介绍一种比较直观简介的估计方式,首先把引入风险分为相对引入风险(relative import risk)和绝对引入风险(absolute import risk)。不妨假设X为疫情爆发区域的某个机场,而Y则是世界上任意一块区域,那么我们可以通过条件概率的形式来定义相对引入风险,即P(Y|X)。而对于绝对引入风险我们则可以通过联合概率来定义,即P(X,Y)=P(Y|X)P(X),这里需要注意的是P(X)往往远小于P(Y|X),因此P(X,Y)也会远远小于P(Y|X)。在实际应用中,相对风险较绝对风险而言更有价值,其主要原因在于P(X)的估计在大部分时间都难以实现,事实上P(X)的估计需要依赖于大量的参数来描述X所在地区的各类因素,而绝对风险的估计却恰恰依赖于P(X)。与此相反,相对风险的计算则仅仅需要各机场人口流动的数据即可,即无需考虑地区本身的相关因素。

将全球各地的机场数据整合后,人们即可以得到各地点相对引入风险的估计值,下一步则是考虑如何将分析结果向公众展示。显然数据可视化往往是直观有效展示分析结果的最佳方式,有人提供了一种基于D3实现的交互式网络分析图表。(图一展示了一个交互式图表的截图。有兴趣的读者可翻阅原图。图表链接:https://rocs.hu-berlin.de/D3/ebola/)

yq01

图1

2. 由移动通信数据预测疫情

埃博拉病毒在西非的爆发引起了全世界的关注,人们纷纷把注意力头像了机场等引起人口流动的公共场所,正如上一节所说,机场数据的确对于流行病学家等研究者们而言具有极高的分析价值,但除此之外,基于手机移动端产生的数据同样极具应用潜力。

用户每次利用手机通话的过程中都会同时产生相应的通话记录数据,其中自然也包含了电话号码、通话时间以及大致的通信地点等重要信息。对于运营商而言,这些数据可以为各地基站的部署提供参考从而提升通信网络。另一方面对于城市规划者而言则可以基于该数据判断相关地点是否需要拓展相应的公共交通设施。

然而除了上述这些相对常用的应用外,在流行病学的应用却更令人期待,更激动人心。事实上到目前为止一般情况下对于疾病扩散建模的常用方法依然是基于人口普查的数据以及相关调查。然而对于通信记录数据,人们却可以得到实时更新的数据,也就是说在实际应用中无需估计某地区的人口是否会迁移。同时幸运的是,在近几年中确实并不缺乏类似的成功案例。2009年在墨西哥爆发的猪流感,研究人员就曾利用通信数据监测公众对于政府发布的健康预警信息的反应。此后2010年随海地地震爆发的霍乱疫情,研究人员则同样基于手机通信数据建模并给出了最需要援助地点的最优估计。

上一页1234下一页

上一篇:数据科学家可能成为2015年最热门职业
下一篇:互联网征信:如何处理数据问题是关键
精选推荐
哈佛大学《自然》发表新驱动技术,让飞行机器人悬停且不受损伤
哈佛大学《自然》发表新驱动技术,让飞行机器人悬停且不受损伤

[2019-11-06]  哈佛大学研究人员发表在《自然》杂志上的一项最新研究,他们开发了一种由柔软的人造肌肉驱动的机器人蜜蜂(RoboBee),这种机器人在撞墙、 ...

智能机器人困惑的时候知道该问什么问题
智能机器人困惑的时候知道该问什么问题

[2017-03-20]   照片:Nick Dentamaro 布朗大学 上周,我们提到了麻省理工学院的一些研究,即通过链接人的大脑来帮助机器人在他们将要犯错误的时 ...

[2017-03-21]  虽然有很多关于机器人取代工人的担心,但哈佛经济学家James Bessen的论文指出,在过去的67年里机器人仅仅淘汰掉人类工作中的一个。在1950 ...

麻省理工正研究植物机器人 让植物自主控制机器人
麻省理工正研究植物机器人 让植物自主控制机器人

[2018-12-08]  控制论通常指人类用机器人部件增强自己。我们听说过动物机器人或昆虫机器人,但我们很少听说植物机器人对吧?一个机器人其实是对植物有很大益处的,因为一般植物根本无法移动......

机器人灵巧手将成为智能机器人的下一个重大突破
机器人灵巧手将成为智能机器人的下一个重大突破

[2018-01-25]  计算机科学教授兼东北地区助手机器人实验室负责人罗伯特·普拉特(Robert Platt)说:“机器人手操作是下一步要解决的问题。想象一下,一个机器人可以在现实世界中用手去做事......

科学家从蟑螂获得启发 教机器人更好地走路
科学家从蟑螂获得启发 教机器人更好地走路

[2017-12-11]  Weihmann指出:“我特别感到惊讶的是,动物运动稳定机制的变化与腿部协调的变化是一致的。昆虫的慢运行非常稳定,因为它的重心很低,三条腿总是以协调的方式运动。...

受大脑控制的机器人
受大脑控制的机器人

[2017-03-21]   想让机器人做我们想做的,首先,他得全面地了解我们。通常,这就意味着人类需要要付出更多。比如,教机器人复杂的人类语言或者把一项任务 ...

机器人iCub作为嵌入式AI的标准机器人研究平台的重要性
机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24]  机器人的研究在过去10年中得益于一个具有嵌入式人工智能(AI)的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建,如今在欧洲、美国、韩国、新加坡和日本的实验室......

本周栏目热点

[1970-01-01]   这可能是未来最具发展潜力的职业之一,我们从职场角度为你解读如何成为 大数据 工程师,以及它的职业发展 ...

从Facebook社交媒体情绪实验看大数据道德困境

[1970-01-01]   今年曝光的Facebook私自进行社交媒体用户情绪实验的新闻引起了不小的争议,这把很多数据实验卷入到社会 ...

大数据时代的美国隐私权保护制度

[1970-01-01]   2014年5月,美国总统执行办公室(Executive Office of the President)发布2014年全球大数据白皮书 ...

那些年,曾经被我们误读的大数据

[1970-01-01]   如今,业界和学术界一直在热议大数据,不管是学术圈还是IT圈,只要能谈论点儿大数据就显得很高大上。然 ...

未来农业将在田里处理大数据

[1970-01-01]   基普·汤姆(Kip Tom)是第7代家庭农场主,他的农场种植的主要农作物是玉米和大豆,他同时也在进行玉 ...