爱吧机器人网 » 技术 > 大数据 > 正文

云计算和大数据延伸至生命信息领域:生物云计算

随着互联网的普及和技术的发展,大数据和云计算已经渗透在人们的生活的各个方面,在金融,零售,能源,交通等领域已经得到广泛应用。而对于生物信息来说,生物的DNA,基因序列,生物芯片等无时无刻不产生新的数据;比如说,DNA测序每年能够产生大约150亿兆(PB级)的数据,如果将这些数据存储在DVD中,那么刻录出来的DVD能够达2.5英里高。生命科学的数据来源和形式多样,包括基因测序、分子通道、不同的人群等。每个临床试验需要千上万病患的数年统计资料,而DNA测序的每个样本产生的数据则以兆兆位计算;如果能高效、高速地利用这些大数据,无疑将为生命科学领域带来无限机遇,但如何分析利用也带来了全新挑战。生物云计算便能很好的解决这些问题;

1)云存储:利用世界上成百上千台服务器云,通过分布式计算系统,取得廉价、便捷的服务;

2)云计算与大数据分析:通过大数据处理软件将复杂,繁琐的数据通过可视化,简单化的方式呈现出分析结果。

生物云计算

大数据,云计算,生物医学——三个炙手可热的关键字和在一起会是什么效果?从应用角度出发,这个可以是SaaS,可以是PaaS;下面介绍一些国内外的生物云计算公司,从四个方面来重点介绍一下在云出现的比较有影响的在云端生物学大数据的应用。这四个方面分别是基因测序,临床药物研发管理以及健康管理

1) DNAnexus

DNAnexus

DNAnexus 是一家致力于打造云端 DNA 数据库的创业公司,并把这些数据提供给研究人员和科学家。目的是将更多基因存储至云端,实现基因的便捷的访问和对比分析。该项目同时还提供人类基因数据备份,基因检索和配对等。通过检索和配对,医生可以从数千万的基因信息中找到对病人有效的药物。目前 DNAnexus 的用户已经包括斯坦福大学和哈佛大学等高校,制药公司,某些医生也会通过DNA 信息来诊断病情。公司提供的服务初衷解决在实验室经过测序仪大量数据的问题,人类基因测一次数据,原始数据在100个G到600个G之间,通过服务导入到云服务平台,后来提供了非常灵活的多样化的各类各样的关于数据的测序分析和比对的工作流程,数据可以有效的管理起来,并且测序结果能够很好的以用户很好的形式展现出来。该公司获得Google领投的1500万美元的融资。2014年1月,Google基因组开启了基因组云存储服务,目前谷歌基因组存储数据费用为100GB数据25美元一年,可满足单个人的原始基因信息存储。且在经过谷歌特殊算法的处理后,可压缩至1GB,费用也将降至25美分。

2)Seven Bridges Genomics

Seven Bridges Genomics

SevenBridges Genomics是美国一家创业公司,主要提供基因排序研究和生物制药产品服务,实现生物信息的可视化,数据分析等方面。Seven Bridges Genomics在人类基因组排序和分析中综合应用了云计算和NoSQL数据的技术,比如EC2、S3和MongoDB。为了降低数据存储成本,他们还采用了Glacier。Seven Bridges PaaS提供了一个设置数据通道的界面,这些通道可以基于预定义的模型,也可以根据当前任务进行调整。

3)crossbow

crossbow

Crossbow是一款能够用于完整基因组重新排序分析的工具。经过对多个类库进行整合,它可以借助AWS只花不到100美元的成本在3小时之内分析完一个人类基因组。对于有志于从事生物信息的开发人员来说,这是一个非常好的工具。这是对全基因分析的流程软件,它的意义在于原来开发之前,完成一个人健康分析的在单个服务器,这软件通过亚马逊云平台上的Hodoop把时间缩小了。结果来看,它现在在32CPU核上任务压缩3小时不到,整个成本不到100美元,这是众多工作中的一部分。

4)Explorys

Explorys

Explorys公司成立于2009年,是一家临床医疗数据管理应用公司,是克利夫兰诊所派生的创新公司。公司利用大数据提高医疗水平和服务质量。公司通过最强大的医疗计算平台把各个系统的数据联系在一起,提供完整的临床整合、高危人群管理、医疗费计算解决方案以及业绩计薪解决方案。该平台拥有2050亿临床、财务、运行数据元,覆盖3800万名患者、300家医院、215,000多名医疗服务提供者。18家大型综合医疗系统正在使用可靠的Explorys云计算平台确定疾病的类型、治疗方案和治疗效果。它是基于私有云的模式,向第三方机构提供服务,第三方机构可以把自己临床数据、运维数据财务数据托管到这个平台来,这个平台提供最大的好处能实时提供数据分析,这个规模托管了1300万人,大概4400亿的内容,数据规模在60个TB左右,2013年达到70个TB,顶层技术在Hodoop上走的。

5)Illumina

Illumina

Illumina公司是遗传变异和生物学功能分析领域的优秀的产品、技术和服务供应商。Illumina销售各种各样的DNA相关产品,包括基因测序仪器、分析相关数据的软件和服务。通过帮助客户加快实现生物信息的采集、分析和应用,来改善人类健康。当前,Illumina拥有基因组测序仪市场70%的份额。公司今年1月,Illumina发布了新款高端基因测序仪,可以准确测出全基因组序列,而成本还不到1000美元。当前,基因组测序已经不再是一个简单的研究工具,读取人类全部DNA的费用已经降至足够低,甚至可以用来解决一些医疗问题,并确定治疗方案。

上一页12下一页

上一篇:大数据时代之hadoop:了解hadoop数据流(生命周期)
下一篇:大数据商业化让个人隐私无处遁形
精选推荐
为未来战场创造更有效的机器人 美国陆军研究人工纳米马达
为未来战场创造更有效的机器人 美国陆军研究人工纳米马达

[2019-10-11]  为了使机器人在战斗中更有效、更多才多艺地成为士兵的战友,美国陆军研究人员正在执行一项任务,即研究肌肉分子生命功能的价值,以及复制过 ...

机器人从工业走向家庭  库卡KUKA目标是引领中国市场
机器人从工业走向家庭 库卡KUKA目标是引领中国市场

[2017-12-08]  机器人正在改变着人们的生活方式,而库卡KUKA想要在中国这个大蛋糕中占有一块大份额,库卡公司正在引领市场...

可编辑神经网络,有望简化深度学习?
可编辑神经网络,有望简化深度学习?

[2019-10-04]  深度学习是一个计算繁重的过程。 降低成本一直是 Data curation 的一大挑战。 关于深度学习神经网络大功耗的训练过程,已经有研究人员 ...

谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图
谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图

[2019-10-26]  谷歌刚刚宣布,其搜索引擎的核心算法正在进行一项重大升级,这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术(BERT ...

[2017-03-21]  虽然有很多关于机器人取代工人的担心,但哈佛经济学家James Bessen的论文指出,在过去的67年里机器人仅仅淘汰掉人类工作中的一个。在1950 ...

MIT最新“人机”互连系统 让双腿机器人复制人体技能
MIT最新“人机”互连系统 让双腿机器人复制人体技能

[2019-11-01]  MIT的小爱马仕想借用你的大脑 ,图片来自: João Ramos爱吧机器人网消息,麻省理工学院(MIT)的研究人员展示了一种新型遥操作系 ...

2022年全球工业机器人市场将达到790亿美元
2022年全球工业机器人市场将达到790亿美元

[2017-09-04]  预计到 2022年, 全球工业机器人市场将达到790亿美元, 并在预测期内登记11 5% 的复合年增长率。随着发展中国家中小型企业需求的不断增长, 采用自动化技术以确保生产质量......

麻省理工学院最新研究:优化软体机器人的控制和设计
麻省理工学院最新研究:优化软体机器人的控制和设计

[2019-11-24]  软体机器人属于一个新的领域,它可能在诸如外科手术等领域发挥重要作用(手术时的纳米机器人需要在人体内部移动而不损伤软组织)。软体机器 ...

本周栏目热点

[1970-01-01]   这可能是未来最具发展潜力的职业之一,我们从职场角度为你解读如何成为 大数据 工程师,以及它的职业发展 ...

从Facebook社交媒体情绪实验看大数据道德困境

[1970-01-01]   今年曝光的Facebook私自进行社交媒体用户情绪实验的新闻引起了不小的争议,这把很多数据实验卷入到社会 ...

大数据时代的美国隐私权保护制度

[1970-01-01]   2014年5月,美国总统执行办公室(Executive Office of the President)发布2014年全球大数据白皮书 ...

那些年,曾经被我们误读的大数据

[1970-01-01]   如今,业界和学术界一直在热议大数据,不管是学术圈还是IT圈,只要能谈论点儿大数据就显得很高大上。然 ...

未来农业将在田里处理大数据

[1970-01-01]   基普·汤姆(Kip Tom)是第7代家庭农场主,他的农场种植的主要农作物是玉米和大豆,他同时也在进行玉 ...