爱吧机器人网 » 技术 > 大数据 > 正文

埃博拉病毒——大数据时代的疫情防控

在对于埃博拉病毒研究的实际操作中却更为复杂,一个最主要的原因在于西非大部分民众并没有手机或者其他通信设备。不过尽管如此,某种程度上它却依然优于基于陈旧数据的统计分析。事实上研究人员如果可以从一个传染病爆发的地域追踪到人口的流动,那么对于下一个最有可能爆发传染病的地点就会有一个比较有效的估计和预测,从而可以提前展开合理有效的资源配置。遗憾的是,尽管很多相关的机构都做了很大程度的努力,但出于隐私等问题的考虑,电信运营商依然不允许研究人员使用这部分数据。

3. 由社交媒体数据预测疫情 [4]

网络和社交媒体数据,对埃博拉病毒的预警,发挥了重大作用。HealthMap是一个利用大数据反应疫情的网站/应用,它使用一定的算法来抓取来自社交媒体网站、本地新闻和政府网站、传染病医师的社交网络和其他渠道的数据,用于探测和跟踪的疾病暴发。2014年3月14号,HealthMap通过自己的系统,预警了几内亚境内爆发的“神秘出血热”。2014年3月19号,HealthMap确认其为埃博拉病毒并对世界卫生组织发出警告,还给出了其在几内亚东南部热带雨林地区传播的粗略地点和路径。2014年3月23号,世界卫生组织正式宣布埃博拉疫情爆发并报告了第一个确诊案例。在这时,HealthMap已经追踪了在几内亚的29例确诊和29人死亡 ——所有数据和报告都来源于社交媒体和当地政府网站等。

HealthMap利用复杂而算法,过滤不相关的数据,结合领域内专家的帮助,再对相关的信息进行分类,确定疾病的类型并在地图上定位爆发地点。针对这次埃博拉疫情,在世界卫生组织宣布当天,HealthMap就上线了专门的页面,其中包含一个实时可交互的地图。全球网友可以通过这个可交互地图来免费了解疫情,其中包括具体的暴发地点和跟踪新的病例和死亡人数的信息。该系统还能够记录公众的关注度。用户可以在地图上放大特定的国家和地区,上面会标记主要病例报告。用户点击标记会指向爆发的新闻报道。同时,在地图底部的滚动条可以让你通过点击关键日期,以追踪病情进展。

这不是HealthMap第一次立功了。这个组织成立于2006年,由一组研究人员,流行病学家和软件开发人员组成的团队,利用网上各式各样的数据来源,监测和预测的疾病暴发,并实现对公共健康威胁的实时监控。他们汇集了各式不相干的数据源,包括网络新闻集中平台,目击者报告,专家策划讨论和官方验证的报告。除了实时和可交互的呈现数据,HealthMap也致力于预测疾病风险。曾经有报导称,该组织成功使用boosted regression tree等模型成功预测了SARS在中国境内爆发的死亡率。

HealthMap的官网宣称,他们主要的数据来源是 ProMED(一个国际传染病协会,成员主要为一线医生和研究人员)邮件列表、世界卫生组织官网,GeoSentinel(来自国际旅行医学协会和美国疾病预防控制中心的临床医生以个人身份的检测)、世界动物健康组织官网、联合国粮农组织、EuroSurveillance(欧洲地区以同行评审为目的的传染病监测和交流的信息平台)、Wildlife Data Integration Network(一个全球野生动物基本新闻源)、谷歌新闻搜索,百度新闻和搜搜资讯。另一份公开发表的论文显示,大部分数据来自ProMED (61. 58%),谷歌等其他搜索引擎新闻则贡献了25. 24%,除此之外比较重要的来源还包括 RSS 订阅(12. 11%), 推特等社交媒体(8. 7%)[5]。这和新闻中极力鼓吹的完全通过社交媒体预测埃博拉疫情,似乎还是有一定的差距。这个社交媒体并不是大众所以为的普通公开社交媒体,而是全球一线医护人员建立的社交网络。事实上,谷歌以及其他一些社交媒体都试图通过抓取网络关键词来监控和预测疾病信息,但是并没有取得如此好的效果。谷歌曾经宣称自己的系统很好地预测了美国每一季的流感爆发,而实际数据显示,他们的系统常常高估了患病率。普通人对疾病的感知和在社交网络的分享,的确不如实际病情那么准确。另一方面,推特的数据显示,埃博拉引起了美国用户前所未有的恐慌,各州的讨论数字一片飘红,网络极端言论层出不穷。但实际上美国至今也只有4个确诊案例和一个死亡案例。

来自以色列贝斯医疗中心的临床信息学专家Brad Crotty博士在接受采访时说,HealthMap事实上还有很多工作要做,以排除“背景噪音”。这位专家并不是这个组织的成员。

Crotty博士说:“你的确可以得到早期预警,但他们并不总是正确的。”

而正在负责HealthMap运营的Sumiko Mekaru博士则称,他们的本意是作为传统和官方健康报告的辅助,而不是取代它们。

二、疫情死亡率的计算与估计[6]

死亡率的计算十分重要,特别是对于传染性疾玻病死率在流行病学中是一个非常重要的估计指标,因为它告诉我们感染特定疾病后死亡的概率。如果正在爆发中的估算准确,甚至可以帮助我们确定病毒是否在危害性方面发生变异,以及研究最合适的治疗方案。

正在西非乃至全球 肆虐的埃博拉病毒,有着众所周知的高致死率。在以往 的爆发中,高达90%的被感染者死于埃博拉。和本次大爆发同宗的扎伊尔型埃博拉病毒以往平均死亡率为80%。这也是为什么,世界卫生组织最新疫情报告中的数据看起来有那么一丁点像好消息—— 尽管埃博拉感染率正在以惊人的速度攀升,报告中整体死亡率却只有53%,从塞拉利昂的39%到几内亚的64%。这比以往几次疫情爆发要相对温和一点。难道是这次爆发的病毒比以往的致死率与危害性低一点?还是说我们已经有了更有效的治疗方案?

实际上此处有一个隐情:明显降低的死亡率可能更多是因为官方测算方式的缘故,而非病毒的致死率,或者说患者接受的治疗水平导致的。事实上,最近几周感染人数的急剧增加,正是报告死亡率看起来不那么高的其中一个主要原因。

官方所谓的死亡率,或者说一个爆发疾病的“病死率”,有若干计算方式。其中最为简单的,就是目前死亡人数除以目前总感染人数。世界卫生组织最近报告的死亡率也就是这样计算的。

上一页1234下一页

上一篇:数据科学家可能成为2015年最热门职业
下一篇:互联网征信:如何处理数据问题是关键
精选推荐
17世纪的莱布尼茨试图制造“思想机器”却被现实打脸
17世纪的莱布尼茨试图制造“思想机器”却被现实打脸

[2019-11-05]  莱布尼茨,德国哲学家、数学家、律师,历史上少见的通才1666年,德国博学家戈特弗里德·威廉·莱布尼茨(Gottfried Wilhelm Leibniz)发 ...

Waymo:人性和行为心理学才是无人驾驶最大的挑战
Waymo:人性和行为心理学才是无人驾驶最大的挑战

[2019-11-03]  自动驾驶汽车作为AI领域内最大的挑战之一,谷歌致力于其研发已有十余载,现在他们逐渐意识到,最困难的是如何让人们享受驾驶的乐趣。这是一 ...

九台“猎豹”机器人组队踢球,麻省理工高材生们的高级趣味
九台“猎豹”机器人组队踢球,麻省理工高材生们的高级趣味

[2019-11-09]  本周,在麻省理工学院10号楼外草坪上展开了一场别开生面的足球比赛。在绿草如茵的基利安球场上,一群由人工智能驱动的机器人就是这场比赛的 ...

麻省理工又秀神技:推出如魔法般跳跃的方块机器人集群
麻省理工又秀神技:推出如魔法般跳跃的方块机器人集群

[2019-10-31]  几天前,小编向大家介绍过麻省理工(MIT)研发的一种自组装机器人集群(点此阅览),它们可以用统一标准的小单元自动组装出各种大型结构。 ...

这些人型机器人是如此真实,你的肉眼几乎无法区分
这些人型机器人是如此真实,你的肉眼几乎无法区分

[2017-09-03]   我们生活在一个区分现实与幻想变得越来越困难的世界。由于机器人技术的进步,创造人工的人类正在逐渐接近完美的最终目标。我们现在看到的机器人不再只是一块发光二极管,......

集群机器人领域最新研究:一种用于探测未知环境的微型无人机群
集群机器人领域最新研究:一种用于探测未知环境的微型无人机群

[2019-10-26]  (图:无人机扩散至不同方向来探索环境。当一个无人机注意到另一个无人机在它的首选方向,它将试图飞到另一个方向。若首选方向冲突,低优先 ...

人工智能准确预测患者一年内的死亡风险,原理却无法解释
人工智能准确预测患者一年内的死亡风险,原理却无法解释

[2019-11-13]  图片来自BURGER PHANIE SCIENCE PHOTO LIBRARY美国最新研究显示,人工智能通过查看心脏测试结果,以高达85%以上的准确率预测了一个人在一 ...

瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作
瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作

[2019-07-12]  EPFL(瑞士联邦理工学院)的研究人员受到了蚂蚁的启发,开发了一款仅有10克重的小型机器人:他们可以相互交流,分配角色并完成复杂的任务。 ...

本周栏目热点

做为一名大数据新手 应该通过这篇文章了解大数据

[2018-07-23]  一、大数据是什么?大数据,big data,《大数据》一书对大数据这么定义,大数据是指不能用随机分析法(抽样调查)这样捷径,而采用所有数据进 ...

BAT大数据野心:数据生产全链条浮现

[2016-07-12]   本报记者 周慧 北京报道导读以BAT为代表的中国 互联网 企业,在数据领域各有千秋,百度的搜索数据、阿里的电商数据、腾讯的社交数 ...

为什么说发展大数据是有道理的

[1970-01-01]   近日,习主席考察贵州时提到:贵州发展大数据确实有道理。那么为什么说发展大数据是有道理的?从历史的 ...

《时代周刊》:用形象化的老办法对付大数据

[1970-01-01]   《时代周刊》最新一期封面文章称,我们每天被数据海洋淹没,只有让冷冰冰的数据形象化,变成看得见摸得 ...

从Facebook社交媒体情绪实验看大数据道德困境

[1970-01-01]   今年曝光的Facebook私自进行社交媒体用户情绪实验的新闻引起了不小的争议,这把很多数据实验卷入到社会 ...