爱吧机器人网 » 专题 > 应用 > 正文

科学家利用人工智能发现近 6000 种未知病毒

核心提示:科学家利用人工智能发现近 6000 种未知病毒。近日,在美国能源部(Department of Energy)举办的会议中,研究员展示了一种新的机器学习

科学家利用人工智能发现近 6000 种未知病毒。近日,在美国能源部(Department of Energy)举办的会议中,研究员展示了一种新的机器学习工具,可探索地球上无数未知的病毒。

\

利用机器学习发现新病毒

虽然病毒影响着我们的日常生活,例如我们的健康,或垃圾的分解,不过由于科学家无法在实验室中培养大多数的病毒,而且病毒的基因体很小、进化快速,所以科学家一直以来都难以识别病毒的基因序列。

近年来,研究人员尝试从不同环境的样本进行 DNA 定序,希望能寻找出未知的病毒。为了识别存在的微生物,研究人员搜寻已知病毒和细菌的基因特征,就像文字处理软件的「寻找」功能,找出文件中的特定文字一样。不过因为病毒学家无法寻找未知的东西,所以这种方法往往失败。

不过,机器学习能解决这个问题,这种方法能在大量的讯息中找出有意义的规律。机器学习算法能分析数据,从中学习,然后自主分类信息。

南加州大学(University of Southern California)的计算生物学家任杰博士(Jie Ren)表示:「以往,人们没有研究病毒的好方法,但现在我们终于有一个工具可以寻找它们。」

训练丝状噬菌体科病毒家族

最新的研究中,美国能源部联合基因体研究所(Joint Genome Institute,简称 JGI)的计算生物学家鲁林博士(Simon Roux),训练计算机从一个不常见的丝状噬菌体科(Inoviridae)病毒家族,去识别病毒的基因序列。这些病毒生活在细菌中,并改变宿主的行为,例如,它们会让霍乱弧菌的毒性更强。在鲁林博士开始研究前,估计只发现了不到 100 个品种。

鲁林博士提出了一种机器学习算法,这种算法包含两个数据集。一个数据集含有 805 个丝状噬菌体科基因序列,另一个则含有大约 2000 个来自细菌和其他病毒的基因序列,让算法能发现区别的方法。

接着,鲁林博士把庞大的总体基因体数据集提供给模型。计算机找到了超过 10000 个丝状噬菌体科基因体,并将其聚集成不同物种的集群。鲁林博士表示,其中一些集群之间的遗传变异非常大,所以丝状噬菌体科可能是很多家族组成的。

\

发现提升堆肥处理效率的新病毒

在另一项研究中,巴西圣保罗大学(University of São Paulo)的生物信息学家戴维·阿姆加藤博士( Deyvid Amgarten),利用机器学习在城市动物园寻找堆肥中的病毒。他撰写算法来搜寻病毒基因体的一些显著特征,例如特定长度的 DNA 链上的基因密度。

阿姆加藤博士表示,经过训练后,计算机找到了几个似乎是新的基因体。最后一步是了解这些病毒产生的蛋白质,看看其中一些蛋白质能否加快有机物质的分解速度,并希望能提升堆肥处理的效率。

发现病患身上的新病毒

阿姆加藤博士从任杰团队开发的机器学习工具 VirFinder 得到线索。VirFinder 可寻找 DNA 链上的碱基配对,例如 AT 或 CG。任杰博士将这种算法应用在健康者和肝硬化患者粪便的总体基因体样本上。计算机对样本中的病毒进行分类之后,研究团队注意到,与肝硬化患者相比,正常人的某些特定类型基因体更多或更少,这表示某些病毒可能导致这种疾病。

任杰博士的研究相当引人注目。长久以来,医学生物研究人员一直希望了解,病毒是否会导致一些难以发现病因的疾病,例如慢性疲劳症候群(又称肌痛性脑脊髓炎)和发炎性肠道疾病。杰克森实验室(Jackson Laboratory)免疫学家尤努马兹教授(Derya Unutmaz)推测,病毒可能会引发破坏性发炎反应,或者可能会改变人类微生物群系(microbiome)中细菌的行为,进而破坏新陈代谢和免疫系统。

尤努马兹教授表示,透过机器学习,研究人员可能会发现隐藏在病患身上的病毒。此外,由于机器学习可在庞大的数据集中找出规律,这种方法可以将病毒数据与细菌进行关联,并将病症数据与蛋白质变化进行关联。尤努马兹教授表示:「机器学习可以发现我们从未想到的知识。」

上一篇:人工智能已在我国大规模应用于癌症早期筛查
下一篇:AI将成科学家“高级定制”工具 制造分子问人工智能AI

本周栏目热点

用Pepper机器人点披萨 这创意居然让必胜客想了出来

[2018-04-22]  这个星期,新加坡榜鹅的一家必胜客快餐店来了一位新员工,它的亮相让吸引了不少必胜客快餐店内顾客的目光,而这位新员工不是别的,正是一款...

人工智能已在我国大规模应用于癌症早期筛查

[2018-04-22]  全世界首台人工智能宫颈癌诊断机器人兰丁,能以极高的工作效率,从数字化图像里找到癌细胞的踪迹,实现完全自动化的诊断。目前,诊断机器人已在 ...

科学家利用人工智能发现近 6000 种未知病毒

[2018-04-22]  科学家利用人工智能发现近 6000 种未知病毒。近日,在美国能源部(Department of Energy)举办的会议中,研究员展示了一种新的机器学习 ...

南京惊现机器人停车场!女司机感动到哭!

[2018-04-21]  在南京地铁3号线夫子庙站口的上盖物业,有个很炫的“新科技”—— 机器人 停车场。据了解,在这里停车,司机不用亲自停车,只要将车开进规定区域,机器人会将车移送至停车位......

一带一路倒计时 巡检机器人保驾护航

[2018-04-22]  “一带一路”高峰论坛将在本月举行。最近从国网北京电力了解到,在以往重要政治活动供电保障标准基础上,本次保电技术手段进一步提升,增加了输变电智能安防系统,首次使用输......

胶囊胃镜机器人是消化道疾病检查最佳手段

[2018-04-13]  曾听消化科医生讲述了一个真实的故事,一位患者因不明原因胃痛来到医院,但是因为害怕做胃镜,还是选择先吃药控制住疼痛,后期检查发现已是胃癌 ...

导诊、运药、查房、手术,机器人医院里显神通

[2018-04-19]  脊柱手术机器人正在工作中 查房机器人正在为病人服务生病去医院,一走进门诊大厅,首先为您导诊的不是护士,而是一个可爱的机器人美女; ...

[2018-04-18]  编者按像互联网+一样,人工智能也可以加入诸多领域。从基础研究到新材料开发、从数据分析到医疗诊断,人工智能助手甚至让不少专家相形见绌 ...

精选推荐

揭秘达芬奇手术机器人
揭秘达芬奇手术机器人

[2018-04-19]  达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局(FDA)于2000年通过该标准,旨在利用微创手段 ...

通过对抗性图像黑入大脑
通过对抗性图像黑入大脑

[2018-03-02]  在上面的图片中,左边是一张猫的照片。在右边,你能分辨出它是同一只猫的图片,还是一张看起来相似的狗的图片?这两张图片之间的区别在于, ...

德国研发出一种能在你体内工作的微型机器人

[2018-01-26]  纽约时报的报道,德国的研究人员已经开发出一种长约七分之一英寸的机器人,首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路,跳跃,爬行,滚动和游泳。它甚至爬出......

机器人灵巧手将成为智能机器人的下一个重大突破
机器人灵巧手将成为智能机器人的下一个重大突破

[2018-01-25]  计算机科学教授兼东北地区助手机器人实验室负责人罗伯特·普拉特(Robert Platt)说:“机器人手操作是下一步要解决的问题。想象一下,一个机器人可以在现实世界中用手去做事......

CES 2018:英特尔推出49量子位芯片争夺量子霸权
CES 2018:英特尔推出49量子位芯片争夺量子霸权

[2018-01-10]  在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中,英特尔通过了一个关键的里程碑。近日,这个科技巨头已经推出了一个49个量子位 ...

从AI中窥探人性
从AI中窥探人性

[2018-01-03]  人们对人造智能的恐惧早已成为科幻书籍和电影的极好题材。但现在,一些同样的担忧开始影响关于现实世界AI技术的政策讨论。如果这样的担忧演变成为一种技术恐慌...

2017年:AI渗入云端
2017年:AI渗入云端

[2017-12-29]  云中的人工智能不仅仅是科技巨头的权力游戏,它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

人工智能民主化能否实现取决于科技巨头
人工智能民主化能否实现取决于科技巨头

[2017-12-29]  我们经常听到像谷歌和微软这样的公司说他们希望人工智能民主化。这是一个很好的词,民主化。 但这些公司如何界定“民主化”还不清楚,像AI本身一样,它似乎有点炒作的味道...

美国Natilus公司试飞水上无人货机 设计简单成本降低
美国Natilus公司试飞水上无人货机 设计简单成本降低

[2017-12-28]  Natilus创业公司成立于2014年,其梦想是建造大型无人机,以半价提供比船舶快得多国际货运。在十二月份,Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出
助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出

[2017-12-25]  本文提出了一个大型的、长序列的、用于行人重识别的视频数据集,简称LVreID。与现有的同类数据集相比,该数据集具有以下特点:1)长序列:平均每段视频序列长为200帧,包含丰......