爱吧机器人网 » 技术 > 机器学习 > 正文

转人工智能+基因,机器学习算法提升人类认知

  日前,外媒采访了Deep Genomics CEO Brendan Frey博士,解读了人工智能+基因组学这个热得发烫的词。

  Deep Genomics,源自多伦多大学的一家创业公司。对人工智能稍有了解的人就能看出这个名字的含义:Deep Genomics = Deep Learning + Genomics。Deep Genomics致力于利用机器学习算法来预测基因组上的突变会如何改变细胞,进而知道会给人体带来什么改变。

  Deep Genomics的第一个产品是SPIDEX,预测基因组突变对RNA剪切的影响。关于SPIDEX的方法学细节,可以查看2015年1月的Science。机器学习专家、基因组学专家和精准医疗专家组成的团队,让这个公司很快就登上了Nature Biotechnology、科学美国人、WIRED、CBC新闻等学术、科普、科技和传统媒体。

  如今Deep Genomics已经走出了人工智能和基因组数据整合商业化的一步,而中国会在这条道路上前进多远?

  谈及人工智能,首先要先说说“深度学习”这个词。

  深度学习,Deep Learning,一种模拟人类大脑工作方式的机器学习算法,近年来被广泛用于语音识别、图像识别等海量非结构化数据学习。Google、Facebook、微软等IT巨头在深度学习领域都投入巨资,国内的百度挖来深度学习领域的华人大神余凯成立百度深度学习研究院,随后再引入深度学习巨匠Andrea Ng担任研究院院长。

  深度学习算法将基因组学带到何处?Brendan Frey博士带你玩转人工智能+基因。

  记者:请您解释为何深度学习算法有助于发现致病基因突变?

  Brendan Frey博士:想要深入理解遗传疾病,首先要了解与疾病有关的突变。然而这样做几乎总是不能识别引起疾病的突变,因为突变是成群发生的,且与疾病有关因果关系常常被埋葬在一堆非因果关系的变异中。

  真正的因果变异通过一连串的细胞过程来引起基因突变,确定因果变异对疾病的确定非常重要,同时对如何使用药物或基因编辑来治疗疾病也非常重要。最近的数据显示,此类遗传信息可使医药研发的成功机会增加三倍。深度学习算法可在计算机系统中分析因果变异的级联过程。

  记者:评估一个基因突变是否会导致疾病,为何预测蛋白绑定尤其重要?

  Brendan Frey博士:DNA通常被称为“生命之书”,那么细胞如何阅读这本书?它们利用蛋白质来识别DNA中的每个单词,并将这些词绑定起来产生其他效果。蛋白质在细胞级联过程中起着重要的作用。DNA突变经常会干扰蛋白质的绑定作用,使其绑定在错误的位置。因此,精准确定蛋白质在何时何地绑定对理解和治疗疾病非常重要。

  记者:为何很难预测蛋白质何时何地绑定到DNA和RNA序列上?

  Brendan Frey博士:蛋白质是否绑定是由复杂的生化反应决定的,事实上,蛋白质是否绑定是一个级联反应过程,涉及到DNA和RNA中的每个碱基以及碱基的组合,同时还涉及到其他蛋白质。

  记者:请您概述一下DeepBind,并解释它是怎样计算蛋白质是否会绑定到一个序列上,从而影响细胞过程?

  Brendan Frey博士:顾名思义,DeepBind将深度学习算法与DNA或RNA序列级联反应识别模式相结合,用于确定蛋白质是否绑定到序列上。由DeepBind得到的级联反应可能与细胞内的情况不符,但重要的是DeepBind可以解释DNA或RNA中每个碱基的复杂组合。

  由于实际的细胞过程包括这些复杂的组合,DeepBind可以找到这些组合的关系。然而DeepBind并不能完美的预测,但与其他技术相比DeepBind的表现最好。

  记者:DeepBind对人类基因数据分析有何帮助?

  Brendan Frey博士:我们很兴奋,DeepBind可能打开世界临床和研究工作的新大门。我们已经利用DeepBind来识别破坏蛋白质绑定的突变位点。在这一点上,很明显DeepBind可以识别突变与疾病之间的关系,而行业标准方法是无法办到的。例如我们使用DeepBind来检查与家族性高胆固醇血症和卵巢癌疾病有关的,破坏蛋白质绑定或导致蛋白质绑定错误的突变。

  记者:如何在SPIDEX系统建立DeepBind?这两个工具要连接到电脑系统上吗?

  Brendan Frey博士:Deep Genomics有一个先进的科学技术路线用于构建一个可以连接解释不同细胞过程的大量组件的计算机系统。对于人类突变,SPIDEX系统正如谷歌引擎的一部分。事实上,SPIDEX依赖一个简单的系统来预测蛋白质的绑定作用。如今我们打算用DeepBind替换这个简单的系统,使SPIDEX生成更准确的数据。所有组件的交互作用以及改进其中的某个组件将大大提高其他组件的作用。这就是深入学习算法的工作原理。

  记者:谈谈Deep Genomics下一步的开发计划以及深度学习算法和生物基因组学的未来。

  Brendan Frey博士:这是个很好的问题。我们正在开发的是技术而不是工具。我们开发的每一个组件都可以作为一种工具,但是作为“引擎”的动态组件,它们的价值会大得多。

  送入Deep Genomics引擎的基因数据可以生成与病人有关的重要的疾病信息,这些信息可以用于确定治疗方案,反过来又可提高引擎本身。在Deep Genomics引擎中,细胞过程之间的连接方式与谷歌搜索引擎中网页之间的连接类似,当我们收集的数据越多,我们就越能提高生物连接的准确性。

  机器学习算法和基因组学的未来是什么?我相信,基因生物学是深入学习算法的下一个主攻领域。十年前,我在一个深度学习算法早期研讨会中就有提到这个观点。当时其他与会者正在研究计算机视觉、语音识别和文本处理。当时我就指出虽然这些都是引人注目的问题,但人类在这方面做得已经很好了,相反,人类不擅长理解基因组。

  因此,使用深度学习算法来了解基因组和基因突变使人类达到一个新的认识高度:理解人类不曾理解的事情。Deep Genomics的基因组科学顾问——“深度学习之父” Yann LeCun是Facebook人工智能的主导者并不是一个巧合。深度学习算法将给基因组学带来新的里程碑。

  关于Brendan Frey博士

  Brendan博士是机器学习专家、基因组学专家,他领导的团队开发的用于预测基因组突变对RNA剪切的影响,该研究成果与今年一月份在线发表于《Science》上。在过去的20年中,Brendan博士曾在《Science》《Nature》《Cell》上发表过12篇论文。1995年在《Science》中发表了第一篇关于深度学习算法的文章,2010年在《Nature 》发表了一篇文章描述计算机系统预测可变剪接的细胞过程。Brendan曾是微软研究院的技术顾问,拥有七项专利,并是专利诉讼专家证人。

上一篇:机器学习算法可预测出乳腺癌治疗率(图)
下一篇:未来机器人或将能“察言观色”
精选推荐
揭秘达芬奇手术机器人
揭秘达芬奇手术机器人

[2018-04-19]  达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局(FDA)于2000年通过该标准,旨在利用微创手段 ...

谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算
谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算

[2019-10-23]  谷歌坚称自己已经取得了量子霸权——这标志着计算研究领域的一个重要里程碑。谷歌首次发布声明是在今年9月,虽然遭到竞争对手的质疑,但就 ...

人工智能民主化能否实现取决于科技巨头
人工智能民主化能否实现取决于科技巨头

[2017-12-29]  我们经常听到像谷歌和微软这样的公司说他们希望人工智能民主化。这是一个很好的词,民主化。 但这些公司如何界定“民主化”还不清楚,像AI本身一样,它似乎有点炒作的味道...

集群机器人领域最新研究:一种用于探测未知环境的微型无人机群
集群机器人领域最新研究:一种用于探测未知环境的微型无人机群

[2019-10-26]  (图:无人机扩散至不同方向来探索环境。当一个无人机注意到另一个无人机在它的首选方向,它将试图飞到另一个方向。若首选方向冲突,低优先 ...

[2017-03-21]  虽然有很多关于机器人取代工人的担心,但哈佛经济学家James Bessen的论文指出,在过去的67年里机器人仅仅淘汰掉人类工作中的一个。在1950 ...

Waymo:人性和行为心理学才是无人驾驶最大的挑战
Waymo:人性和行为心理学才是无人驾驶最大的挑战

[2019-11-03]  自动驾驶汽车作为AI领域内最大的挑战之一,谷歌致力于其研发已有十余载,现在他们逐渐意识到,最困难的是如何让人们享受驾驶的乐趣。这是一 ...

智能农业:种地的事儿未来全交给这些机器人吧
智能农业:种地的事儿未来全交给这些机器人吧

[2019-12-07]  SRC公司创始人Sam与温波尔庄园农场经理Callum Weir以及监控机器人Tom总部位于英国的农业科技初创公司SRC(Small Robot Company),正在 ...

2017年:AI渗入云端
2017年:AI渗入云端

[2017-12-29]  云中的人工智能不仅仅是科技巨头的权力游戏,它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

本周栏目热点

关于应用机器学习作为搜索问题的入门简介

[2018-01-03]  机器学习的应用可以理解为一个搜索问题,即根据某个项目的已知信息和可获取的资源,找到从输入到输出的最好的映射。在本文你即将看到把应用机器学习当作搜索问题的概念...

[2017-03-02]   随着人工智能的不断发展,许多新的机器学习技术、架构和算法被提出,但这里有三个宏观趋势,将成为机器学习中,游戏规则的改变者。 机 ...

顶级AI会议NIPS压轴2017(附PPT、视频、代码大汇总)

[2017-12-19]  NIPS,全称神经信息处理系统大会(Conference and Workshop on Neural Information Processing Systems),是一个关于机器学习和计算神经科学的国际会议。该会议固定在每年的12月举行...

机器学习之——正则化

[2018-05-18]  最近在刷李航的《统计学习方法》这本书,在很多算法的损失函数里,都出现类似的描述:损失函数最小化原则一般就是用正则化的极大似然估计进 ...

机器学习算法可预测出乳腺癌治疗率(图)

[1970-01-01]    据外媒报道,患有同种疾病的不同病人在接受同一种治疗方案时,其获得的疗效也会存在不同,这就给医生留下了一个难题:他们怎样才能知道 ...