爱吧机器人网 » 专题 > 应用 > 正文

借助机器学习提高CRISPR基因编辑准确率

核心提示:基因编辑技术CRISPR就像是一种纳米级的“针线包”,可以在特定位置上对DNA进行剪切和修改。为了使CRISPR的操作更加准确,研究员们开发出了一套借助机器学习来让CRISPR减少“脱靶效应”的计算

编者按:基因编辑技术CRISPR就像是一种纳米级的“针线包”,可以在特定位置上对DNA进行剪切和修改。为了使CRISPR的操作更加准确,研究员们开发出了一套借助机器学习来让CRISPR减少“脱靶效应”的计算工具——Elevation。目前,Elevation以及另外一款用于预测在靶效应的补充工具Azimuth一起发布在微软Azure上供大家免费使用,同时也以开源的形式向公众开放。本文翻译自Researchers use AI to improve accuracy of gene editing with CRISPR。

微软研究员NicoloFusi,UC Berkeley教授Jennifer Listgarten,Broad研究所副总监JohnDoench
 
从左至右:微软研究员NicoloFusi,UC Berkeley教授Jennifer Listgarten,Broad研究所副总监JohnDoench
 
CRISPR(成簇规则间隔短回文式重复)是一项正在彻底改变医疗保健和农业等众多产业的基因编辑技术,就像是一种纳米级的“针线包”,可以在特定基因的特定位置上对DNA进行剪切和修改。这项技术可能会带来突破性的应用,例如对细胞进行修改以对抗癌症,或生成高产、抗旱的小麦和玉米等农作物等。
 
尽管CRISPR在一些领域有着很好的应用前景,但它也面临挑战:由于很多基因组区域是相似的,纳米级“针线包”可能会意外地在错误的基因上“动手脚”,从而导致意想不到的后果——即所谓“脱靶效应”。
 
为了解决上述难题,来自美国各地研究机构的计算机科学家和生物学家通力合作,开发了一套可提升CRISPR效率和准确性的计算工具——Elevation,它能借助机器学习预测用CRISPR进行编辑基因时可能出现的“脱靶效应”。
 
目前,Elevation以及另外一款用于预测在靶效应的补充工具Azimuth一起,已经作为基于云的端到端服务在微软Azure上供大家免费使用,同时也以开源的形式向公众开放。
 
利用这套工具,研究人员只需输入他们希望修改的基因名称,云基搜索引擎将返回一份向导RNA列表,研究人员可以通过预测的在靶或脱靶效应对其进行排序并选择。


 
源于自然
 
CRISPR基因编辑系统源自自然界反病毒机制。科学家于20世纪80年代后期在细菌的DNA中发现了它,此后花费了数十年的时间弄清了它的工作原理。
 
CRISPR描述了细菌基因组中的一种由多个DNA重复序列区和多个短小的非重复的DNA间隔区组成的DNA序列。非重复间隔区是来自入侵病毒DNA的拷贝,被称为RNA的分子信使将以它为模板,识别后续的病毒侵染。当检测到入侵者时,RNA将CRISPR复合物引导至病毒处,并指派与CRISPR相关(或称Cas)的蛋白质前去切断病毒基因,使之失效。
 
2012年,分子生物学家想出了改造细菌反病毒系统的方法,用于对植物、老鼠乃至人类等各类生物的基因进行编辑,这就是CRISPR-Cas9基因编辑技术。其基本工作机理如下:科学家设计合成向导RNA,与他们希望剪切或编辑的基因中的DNA序列进行匹配,并用CRISPR相关蛋白剪刀(即Cas9)将其释放到某个细胞中。
 
今天,这项技术被当作一种有效、精确的方法,被广泛用于了解生物中基因个体的作用,以及如何通过改变基因来完成从抗击疾病到增加食物供给等各项使命。
 
对于研究人员来说,这个方法最大的挑战就是在给定实验中决定应该选择什么样的向导RNA。因为每个向导RNA中大约有20个核苷酸;在基因敲除实验中,每个标靶基因都有数百个潜在向导RNA。一般而言,每个向导RNA都具有互不相同的在靶效率和不同程度的脱靶问题。
 
计算机科学家和生物学家之间协作的重点是建立工具,帮助研究人员选择最适和当前实验的向导RNA。
 
训练模型
 
为了能解决在试验中正确选择向导RNA的难题,研究人员首先用数据训练了第一层机器学习模型。这些数据记录了与给定的向导RNA有一项核苷酸不匹配的所有可能的标靶区域里发生的脱靶活动。
 
接着,机器学习专家利用哈佛医学院和马萨诸塞州总医院合作者此前生成的公开数据,对第二层机器学习模型进行了训练,将第一层模型加以细化,并推广到存在一个以上不匹配核苷酸的标靶区域中。
 
专家表示第二层模型非常重要,因为脱靶活动往往发生在向导RNA与标靶之间存在多个核苷酸不匹配的情况下。
 
最后,团队用其它几个公开数据集以及哈佛医学院和马萨诸塞州总医院下属合作机构创建的新数据集对双层机器学习模型进行了验证。研究人员发现一些模型特征非常直观的,例如向导RNA与核苷酸序列之间的不匹配。另一些特征则反映了通过机器学习从DNA编码中发现的某些未知属性。
 
脱靶分值
 
脱靶分值是针对基因组上可能发生脱靶活动的每个区域,基于机器学习计算出的概率。针对每一种向导RNA,Elevation为研究人员提供了两类脱靶分值:在某个标靶区域里的单项分值和该向导RNA在所有标靶区域的总分。对于每个向导RNA,Elevation都会返回数百到数千个此类脱靶分值。
 
向导RNA的数量可能成千上万,针对某个特定实验,研究人员想要通过对比这些单项的脱靶分值来选择适合的向导RNA非常困难。所以就需要把所有单项的脱靶分值加总出一个单一的总分,用来反映特定向导RNA的所有潜在脱靶效应在多大程度上会对细胞造成破坏。对于生物学家来说,重要的并非基因组中每个点上的概率,而是某向导RNA的各种脱靶活动导致细胞破坏的总体概率。
 
来自微软研究院、麻省理工学院、哈佛大学、加州大学洛杉矶分校、马萨诸塞州总医院和哈佛医学院的合作者们已经通过Nature Biomedical Engineering杂志发表了关于Elevation的论文。

上一篇:机器人砌墙精确到厘毫,一分钟一面墙让农民工看傻眼!
下一篇:美大学用机器人测室内环境 证实儿童更易吸入有害物质

本周栏目热点

日本机器人酒店推出“无人酒吧” 颇为人气

[2017-11-10]  现在最流行的服务并非是人类的服务,现在最流行的服务也并非就是贴心的服务,现在最流行的服务,是使用最新的人工智能机器人来服务...

私人助理or玩伴?社交机器人纳丁帮你搞定

[2016-03-09]     纳丁有着细嫩的皮肤和柔顺的深褐色头发,面部表情丰富,并且可以记得以前的 ...

两会焦点:机器人能帮孩子减少无效学习时间

[2018-03-12]  在3月11日下午的全国两会第三场代表通道上,科大讯飞董事长刘庆峰在回答记者提问时强调,他们的软件给孩子们节省了时间,让孩子们有更多的...

[2018-03-12]  机器人医生为你看病、做手术不是科幻片,而是纪录片。科技部部长万钢3月10日在出席十三届全国人大一次会议记者会时表示,我国科技人员研发的手术机器人,医疗设备进入了高端医......

 深圳交通已经有人工智能AI?云+人工智能前景太美好

[2018-06-26]  在6月26日华为云中国行深圳站现场,华为云计算首次对外公布了其全新智能体概念并结合具体实践行业做以解释。何谓智能体,华为云郑叶来给出 ...

分析影像识别 国土资源局引入AI技术

[2018-07-17]  山东省淄博市国土资源管理提供了一个重要的遥感数据支撑,这个遥感数据主要分析影像核心的获取部分,当然这也只是第一步,更为重要的是如何快速、及时、低成本的从海量的遥感......

DeltaGrad股票机器人业绩跑赢大盘 基金经理要下岗?

[2018-07-16]  一家来自中国的技术公司DeltaGrad研发的A股AI投资机器人今年以来的投资业绩着实亮眼。从2017年11月开始实盘测试以来,截至2018年7月2日,DeltaGrad的股票机器人业绩累积为收益8 1%...

为智能制造“点睛” 揭秘机器视觉如何成为制造业发展重要推动力

[2018-07-16]  在当前以高端装备制造为核心的智造工业4 0时代背景下,随着“中国制造2025”战略的深入,业智能机器人产业市场呈现不断增长的势头,其中充 ...

脸书AI学习如何指路 竟向其他AI“问路”

[2018-07-20]  位于纽约的Facebook 人工智能研究小组( FAIR )创建了两个人工智能,一个扮演在纽约走失的「游客」,而另一个则为以人类语言帮助他指路的「导游」,这个构想源自于婴儿学......

[2018-07-17]  要说今年来什么高新技术方向最为流行,恐怕非人工智能技术莫属,人工智能技术给各行各业带来了巨大的改变,现在连最古老的酿酒行业也要用上 ...

精选推荐

这些人型机器人是如此真实,你的肉眼几乎无法区分
这些人型机器人是如此真实,你的肉眼几乎无法区分

[2017-09-03]   我们生活在一个区分现实与幻想变得越来越困难的世界。由于机器人技术的进步,创造人工的人类正在逐渐接近完美的最终目标。我们现在看到的机器人不再只是一块发光二极管,......

机器人从工业走向家庭  库卡KUKA目标是引领中国市场
机器人从工业走向家庭 库卡KUKA目标是引领中国市场

[2017-12-08]  机器人正在改变着人们的生活方式,而库卡KUKA想要在中国这个大蛋糕中占有一块大份额,库卡公司正在引领市场...

人工神经网络技术解码人类行为和想象时的大脑活动信号
人工神经网络技术解码人类行为和想象时的大脑活动信号

[2017-08-23]  为搜索引擎过滤信息,棋盘游戏对弈,识别图像 人工智能在某些任务中远远超过了人类智能。来自弗莱堡由神经科学家私人讲师Tonio Ball博士领导的几个杰出的BrainLinks-Bra......

揭秘达芬奇手术机器人
揭秘达芬奇手术机器人

[2018-04-19]  达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局(FDA)于2000年通过该标准,旨在利用微创手段 ...

美国喷气推进实验室的AI驱动无人机挑战人类飞行员
美国喷气推进实验室的AI驱动无人机挑战人类飞行员

[2017-12-08]  随着无人机及其组件越来越小,效率越来越高,功能越来越强大,我们已经看到越来越多的研究开始让无人机自主飞行在半结构化的环境中,而不依赖于外部定位。 宾夕法尼亚大学在......

机器人灵巧手将成为智能机器人的下一个重大突破
机器人灵巧手将成为智能机器人的下一个重大突破

[2018-01-25]  计算机科学教授兼东北地区助手机器人实验室负责人罗伯特·普拉特(Robert Platt)说:“机器人手操作是下一步要解决的问题。想象一下,一个机器人可以在现实世界中用手去做事......

通过对抗性图像黑入大脑
通过对抗性图像黑入大脑

[2018-03-02]  在上面的图片中,左边是一张猫的照片。在右边,你能分辨出它是同一只猫的图片,还是一张看起来相似的狗的图片?这两张图片之间的区别在于, ...

受大脑控制的机器人
受大脑控制的机器人

[2017-03-21]   想让机器人做我们想做的,首先,他得全面地了解我们。通常,这就意味着人类需要要付出更多。比如,教机器人复杂的人类语言或者把一项任务 ...