爱吧机器人网 » 技术 > 机器学习 > 正文

转人工智能+基因,机器学习算法提升人类认知

  日前,外媒采访了Deep Genomics CEO Brendan Frey博士,解读了人工智能+基因组学这个热得发烫的词。

  Deep Genomics,源自多伦多大学的一家创业公司。对人工智能稍有了解的人就能看出这个名字的含义:Deep Genomics = Deep Learning + Genomics。Deep Genomics致力于利用机器学习算法来预测基因组上的突变会如何改变细胞,进而知道会给人体带来什么改变。

  Deep Genomics的第一个产品是SPIDEX,预测基因组突变对RNA剪切的影响。关于SPIDEX的方法学细节,可以查看2015年1月的Science。机器学习专家、基因组学专家和精准医疗专家组成的团队,让这个公司很快就登上了Nature Biotechnology、科学美国人、WIRED、CBC新闻等学术、科普、科技和传统媒体。

  如今Deep Genomics已经走出了人工智能和基因组数据整合商业化的一步,而中国会在这条道路上前进多远?

  谈及人工智能,首先要先说说“深度学习”这个词。

  深度学习,Deep Learning,一种模拟人类大脑工作方式的机器学习算法,近年来被广泛用于语音识别、图像识别等海量非结构化数据学习。Google、Facebook、微软等IT巨头在深度学习领域都投入巨资,国内的百度挖来深度学习领域的华人大神余凯成立百度深度学习研究院,随后再引入深度学习巨匠Andrea Ng担任研究院院长。

  深度学习算法将基因组学带到何处?Brendan Frey博士带你玩转人工智能+基因。

  记者:请您解释为何深度学习算法有助于发现致病基因突变?

  Brendan Frey博士:想要深入理解遗传疾病,首先要了解与疾病有关的突变。然而这样做几乎总是不能识别引起疾病的突变,因为突变是成群发生的,且与疾病有关因果关系常常被埋葬在一堆非因果关系的变异中。

  真正的因果变异通过一连串的细胞过程来引起基因突变,确定因果变异对疾病的确定非常重要,同时对如何使用药物或基因编辑来治疗疾病也非常重要。最近的数据显示,此类遗传信息可使医药研发的成功机会增加三倍。深度学习算法可在计算机系统中分析因果变异的级联过程。

  记者:评估一个基因突变是否会导致疾病,为何预测蛋白绑定尤其重要?

  Brendan Frey博士:DNA通常被称为“生命之书”,那么细胞如何阅读这本书?它们利用蛋白质来识别DNA中的每个单词,并将这些词绑定起来产生其他效果。蛋白质在细胞级联过程中起着重要的作用。DNA突变经常会干扰蛋白质的绑定作用,使其绑定在错误的位置。因此,精准确定蛋白质在何时何地绑定对理解和治疗疾病非常重要。

  记者:为何很难预测蛋白质何时何地绑定到DNA和RNA序列上?

  Brendan Frey博士:蛋白质是否绑定是由复杂的生化反应决定的,事实上,蛋白质是否绑定是一个级联反应过程,涉及到DNA和RNA中的每个碱基以及碱基的组合,同时还涉及到其他蛋白质。

  记者:请您概述一下DeepBind,并解释它是怎样计算蛋白质是否会绑定到一个序列上,从而影响细胞过程?

  Brendan Frey博士:顾名思义,DeepBind将深度学习算法与DNA或RNA序列级联反应识别模式相结合,用于确定蛋白质是否绑定到序列上。由DeepBind得到的级联反应可能与细胞内的情况不符,但重要的是DeepBind可以解释DNA或RNA中每个碱基的复杂组合。

  由于实际的细胞过程包括这些复杂的组合,DeepBind可以找到这些组合的关系。然而DeepBind并不能完美的预测,但与其他技术相比DeepBind的表现最好。

  记者:DeepBind对人类基因数据分析有何帮助?

  Brendan Frey博士:我们很兴奋,DeepBind可能打开世界临床和研究工作的新大门。我们已经利用DeepBind来识别破坏蛋白质绑定的突变位点。在这一点上,很明显DeepBind可以识别突变与疾病之间的关系,而行业标准方法是无法办到的。例如我们使用DeepBind来检查与家族性高胆固醇血症和卵巢癌疾病有关的,破坏蛋白质绑定或导致蛋白质绑定错误的突变。

  记者:如何在SPIDEX系统建立DeepBind?这两个工具要连接到电脑系统上吗?

  Brendan Frey博士:Deep Genomics有一个先进的科学技术路线用于构建一个可以连接解释不同细胞过程的大量组件的计算机系统。对于人类突变,SPIDEX系统正如谷歌引擎的一部分。事实上,SPIDEX依赖一个简单的系统来预测蛋白质的绑定作用。如今我们打算用DeepBind替换这个简单的系统,使SPIDEX生成更准确的数据。所有组件的交互作用以及改进其中的某个组件将大大提高其他组件的作用。这就是深入学习算法的工作原理。

  记者:谈谈Deep Genomics下一步的开发计划以及深度学习算法和生物基因组学的未来。

  Brendan Frey博士:这是个很好的问题。我们正在开发的是技术而不是工具。我们开发的每一个组件都可以作为一种工具,但是作为“引擎”的动态组件,它们的价值会大得多。

  送入Deep Genomics引擎的基因数据可以生成与病人有关的重要的疾病信息,这些信息可以用于确定治疗方案,反过来又可提高引擎本身。在Deep Genomics引擎中,细胞过程之间的连接方式与谷歌搜索引擎中网页之间的连接类似,当我们收集的数据越多,我们就越能提高生物连接的准确性。

  机器学习算法和基因组学的未来是什么?我相信,基因生物学是深入学习算法的下一个主攻领域。十年前,我在一个深度学习算法早期研讨会中就有提到这个观点。当时其他与会者正在研究计算机视觉、语音识别和文本处理。当时我就指出虽然这些都是引人注目的问题,但人类在这方面做得已经很好了,相反,人类不擅长理解基因组。

  因此,使用深度学习算法来了解基因组和基因突变使人类达到一个新的认识高度:理解人类不曾理解的事情。Deep Genomics的基因组科学顾问——“深度学习之父” Yann LeCun是Facebook人工智能的主导者并不是一个巧合。深度学习算法将给基因组学带来新的里程碑。

  关于Brendan Frey博士

  Brendan博士是机器学习专家、基因组学专家,他领导的团队开发的用于预测基因组突变对RNA剪切的影响,该研究成果与今年一月份在线发表于《Science》上。在过去的20年中,Brendan博士曾在《Science》《Nature》《Cell》上发表过12篇论文。1995年在《Science》中发表了第一篇关于深度学习算法的文章,2010年在《Nature 》发表了一篇文章描述计算机系统预测可变剪接的细胞过程。Brendan曾是微软研究院的技术顾问,拥有七项专利,并是专利诉讼专家证人。

上一篇:机器学习算法可预测出乳腺癌治疗率(图)
下一篇:未来机器人或将能“察言观色”
精选推荐

[2018-01-26]  纽约时报的报道,德国的研究人员已经开发出一种长约七分之一英寸的机器人,首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路,跳跃,爬行,滚动和游泳。它甚至爬出......

科学家从蟑螂获得启发 教机器人更好地走路
科学家从蟑螂获得启发 教机器人更好地走路

[2017-12-11]  Weihmann指出:“我特别感到惊讶的是,动物运动稳定机制的变化与腿部协调的变化是一致的。昆虫的慢运行非常稳定,因为它的重心很低,三条腿总是以协调的方式运动。...

7种常见的机器人焊接类型
7种常见的机器人焊接类型

[2017-12-17]  机器人焊接是工业领域最常见的机器人应用之一,近几十年来主要由汽车行业驱动。机器人焊接在完成大批量,重复性的焊接任务时效率最高。...

MIT最新“人机”互连系统 让双腿机器人复制人体技能
MIT最新“人机”互连系统 让双腿机器人复制人体技能

[2019-11-01]  MIT的小爱马仕想借用你的大脑 ,图片来自: João Ramos爱吧机器人网消息,麻省理工学院(MIT)的研究人员展示了一种新型遥操作系 ...

智能农业:种地的事儿未来全交给这些机器人吧
智能农业:种地的事儿未来全交给这些机器人吧

[2019-12-07]  SRC公司创始人Sam与温波尔庄园农场经理Callum Weir以及监控机器人Tom总部位于英国的农业科技初创公司SRC(Small Robot Company),正在 ...

2018年企业数字化转型的五大趋势
2018年企业数字化转型的五大趋势

[2017-12-16]  据2016年哈佛商学院研究表明,选择进行数字化转型的企业在3年内表现出了55%的平均毛利润提升,相比之下其他企业毛利润同期降低了37%。数字化转型企业的领头羊,也曾是收入处于......

这个外科手术机器人可以为患者“量身定制”
这个外科手术机器人可以为患者“量身定制”

[2019-07-12]  世界首创,来自澳大利亚机器人视觉研究中心的研究人员正在推动手术机器人的发展边界,他们创造了可定制的、小型化的手术机器人,能够唯一地 ...

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私
英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14]  英伟达(Nvidia)和伦敦国王学院(King’s College London)的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络, ...

本周栏目热点

深度学习反向传播算法(BP)原理推导及代码实现

[2017-12-19]  分析了手写字数据集分类的原理,利用神经网络模型,编写了SGD算法的代码,分多个epochs,每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中,非常重要的一个步骤,......

如何在机器学习项目中使用统计方法的示例

[2018-07-23]  事实上,机器学习预测建模项目必须通过统计学方法才能有效的进行。在本文中,我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。...

[2017-08-28]  模拟退火(Simulated Annealing,简称SA)是一种通用概率算法,用来在一个大的搜寻空间内找寻命题的最优解。1、固体退火原理:将固体加温 ...

Machine Learning-感知器分类算法详解

[2018-05-31]  今天我们来讲解的内容是感知器分类算法,本文的结构如下:什么是感知器分类算法,在Python中实现感知器学习算法,在iris(鸢尾花)数据集上训练一个感知器模型,自适应线性神......

机器人是怎么深度学习的?

[2016-03-29]      一个人独处时,感觉有点孤单,怎么办?微软亚洲研究院推出的微软小冰,或许 ...