爱吧机器人网 » 专题 > 应用 > 正文

借助机器学习提高CRISPR基因编辑准确率

核心提示:基因编辑技术CRISPR就像是一种纳米级的“针线包”,可以在特定位置上对DNA进行剪切和修改。为了使CRISPR的操作更加准确,研究员们开发出了一套借助机器学习来让CRISPR减少“脱靶效应”的计算

编者按:基因编辑技术CRISPR就像是一种纳米级的“针线包”,可以在特定位置上对DNA进行剪切和修改。为了使CRISPR的操作更加准确,研究员们开发出了一套借助机器学习来让CRISPR减少“脱靶效应”的计算工具——Elevation。目前,Elevation以及另外一款用于预测在靶效应的补充工具Azimuth一起发布在微软Azure上供大家免费使用,同时也以开源的形式向公众开放。本文翻译自Researchers use AI to improve accuracy of gene editing with CRISPR。

微软研究员NicoloFusi,UC Berkeley教授Jennifer Listgarten,Broad研究所副总监JohnDoench
 
从左至右:微软研究员NicoloFusi,UC Berkeley教授Jennifer Listgarten,Broad研究所副总监JohnDoench
 
CRISPR(成簇规则间隔短回文式重复)是一项正在彻底改变医疗保健和农业等众多产业的基因编辑技术,就像是一种纳米级的“针线包”,可以在特定基因的特定位置上对DNA进行剪切和修改。这项技术可能会带来突破性的应用,例如对细胞进行修改以对抗癌症,或生成高产、抗旱的小麦和玉米等农作物等。
 
尽管CRISPR在一些领域有着很好的应用前景,但它也面临挑战:由于很多基因组区域是相似的,纳米级“针线包”可能会意外地在错误的基因上“动手脚”,从而导致意想不到的后果——即所谓“脱靶效应”。
 
为了解决上述难题,来自美国各地研究机构的计算机科学家和生物学家通力合作,开发了一套可提升CRISPR效率和准确性的计算工具——Elevation,它能借助机器学习预测用CRISPR进行编辑基因时可能出现的“脱靶效应”。
 
目前,Elevation以及另外一款用于预测在靶效应的补充工具Azimuth一起,已经作为基于云的端到端服务在微软Azure上供大家免费使用,同时也以开源的形式向公众开放。
 
利用这套工具,研究人员只需输入他们希望修改的基因名称,云基搜索引擎将返回一份向导RNA列表,研究人员可以通过预测的在靶或脱靶效应对其进行排序并选择。


 
源于自然
 
CRISPR基因编辑系统源自自然界反病毒机制。科学家于20世纪80年代后期在细菌的DNA中发现了它,此后花费了数十年的时间弄清了它的工作原理。
 
CRISPR描述了细菌基因组中的一种由多个DNA重复序列区和多个短小的非重复的DNA间隔区组成的DNA序列。非重复间隔区是来自入侵病毒DNA的拷贝,被称为RNA的分子信使将以它为模板,识别后续的病毒侵染。当检测到入侵者时,RNA将CRISPR复合物引导至病毒处,并指派与CRISPR相关(或称Cas)的蛋白质前去切断病毒基因,使之失效。
 
2012年,分子生物学家想出了改造细菌反病毒系统的方法,用于对植物、老鼠乃至人类等各类生物的基因进行编辑,这就是CRISPR-Cas9基因编辑技术。其基本工作机理如下:科学家设计合成向导RNA,与他们希望剪切或编辑的基因中的DNA序列进行匹配,并用CRISPR相关蛋白剪刀(即Cas9)将其释放到某个细胞中。
 
今天,这项技术被当作一种有效、精确的方法,被广泛用于了解生物中基因个体的作用,以及如何通过改变基因来完成从抗击疾病到增加食物供给等各项使命。
 
对于研究人员来说,这个方法最大的挑战就是在给定实验中决定应该选择什么样的向导RNA。因为每个向导RNA中大约有20个核苷酸;在基因敲除实验中,每个标靶基因都有数百个潜在向导RNA。一般而言,每个向导RNA都具有互不相同的在靶效率和不同程度的脱靶问题。
 
计算机科学家和生物学家之间协作的重点是建立工具,帮助研究人员选择最适和当前实验的向导RNA。
 
训练模型
 
为了能解决在试验中正确选择向导RNA的难题,研究人员首先用数据训练了第一层机器学习模型。这些数据记录了与给定的向导RNA有一项核苷酸不匹配的所有可能的标靶区域里发生的脱靶活动。
 
接着,机器学习专家利用哈佛医学院和马萨诸塞州总医院合作者此前生成的公开数据,对第二层机器学习模型进行了训练,将第一层模型加以细化,并推广到存在一个以上不匹配核苷酸的标靶区域中。
 
专家表示第二层模型非常重要,因为脱靶活动往往发生在向导RNA与标靶之间存在多个核苷酸不匹配的情况下。
 
最后,团队用其它几个公开数据集以及哈佛医学院和马萨诸塞州总医院下属合作机构创建的新数据集对双层机器学习模型进行了验证。研究人员发现一些模型特征非常直观的,例如向导RNA与核苷酸序列之间的不匹配。另一些特征则反映了通过机器学习从DNA编码中发现的某些未知属性。
 
脱靶分值
 
脱靶分值是针对基因组上可能发生脱靶活动的每个区域,基于机器学习计算出的概率。针对每一种向导RNA,Elevation为研究人员提供了两类脱靶分值:在某个标靶区域里的单项分值和该向导RNA在所有标靶区域的总分。对于每个向导RNA,Elevation都会返回数百到数千个此类脱靶分值。
 
向导RNA的数量可能成千上万,针对某个特定实验,研究人员想要通过对比这些单项的脱靶分值来选择适合的向导RNA非常困难。所以就需要把所有单项的脱靶分值加总出一个单一的总分,用来反映特定向导RNA的所有潜在脱靶效应在多大程度上会对细胞造成破坏。对于生物学家来说,重要的并非基因组中每个点上的概率,而是某向导RNA的各种脱靶活动导致细胞破坏的总体概率。
 
来自微软研究院、麻省理工学院、哈佛大学、加州大学洛杉矶分校、马萨诸塞州总医院和哈佛医学院的合作者们已经通过Nature Biomedical Engineering杂志发表了关于Elevation的论文。

上一篇:机器人砌墙精确到厘毫,一分钟一面墙让农民工看傻眼!
下一篇:美大学用机器人测室内环境 证实儿童更易吸入有害物质

本周栏目热点

2017年人工智能九大应用

[2018-01-19]  在终端应用方面,智能驾驶仍然是本年度热度最高的话题,在国外不仅马斯克和他的特斯拉时常在风口浪尖,谷歌造车也成为了这一领域的最大看点。回到国内,百度因为前任首席科学......

机器换人已经开始 沃尔玛超市已用上机器人

[2018-01-19]  沃尔玛首席技术官杰里米·金指出,这是一项人类并不十分擅长的工作。爬上爬下来确认商品库存,对人类来说既费力也不讨好,机器人完成任务的速度比人类员工快三倍,还更加准确。...

英科学家借AI协助研究:牙膏成分可对抗疟疾

[2018-01-23]  据报道,人工智能(AI) 机器人 科学家参与的研究表明,牙膏的一种常见成分三氯生可以对抗耐药的疟疾菌株。在《科学报告》的一项研究中, ...

机器人揭开金字塔“神秘大门”秘密,探索古埃及法老王的陵墓

[2018-01-17]  据国外媒体报道,在经历了几乎20次的失败尝试之后,明年研究人员有很大的机会揭露埃及最壮丽的金字塔心神秘大门后面的有什么样的存在。 今年 ...

美大学用机器人测室内环境 证实儿童更易吸入有害物质

[2018-01-17]  香港东网1月15日报道称,家居地板积聚不少肉眼难以察觉的有害微粒,小孩长时间在地面爬或影响健康。美国印第安纳州一所大学最近就设计了一...

人工智能机器人进油田 巡视频率是人工的21倍

[2018-01-17]   1月16日,中石化西北油田首次引入人工 智能机器人 慧眼对变电站进行巡检。据介绍,过去人工巡检一次花费5小时,后期极易疲劳,质量明显 ...

借助机器学习提高CRISPR基因编辑准确率

[2018-01-14]  基因编辑技术CRISPR就像是一种纳米级的“针线包”,可以在特定位置上对DNA进行剪切和修改。为了使CRISPR的操作更加准确,研究员们开发出了一套借助机器学习来让CRISPR减少“脱......

[2018-01-22]  杭州以公诉办案为切入点,以标准化与信息化深度融合为路径,开发智慧辅助办案系统,探索人工智能在司法办案活动中的应用,奏响智慧检察“四部曲”,有效提升了杭州检察工作的......

精选推荐

CES 2018:英特尔推出49量子位芯片争夺量子霸权
CES 2018:英特尔推出49量子位芯片争夺量子霸权

[2018-01-10]  在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中,英特尔通过了一个关键的里程碑。近日,这个科技巨头已经推出了一个49个量子位 ...

从AI中窥探人性
从AI中窥探人性

[2018-01-03]  人们对人造智能的恐惧早已成为科幻书籍和电影的极好题材。但现在,一些同样的担忧开始影响关于现实世界AI技术的政策讨论。如果这样的担忧演变成为一种技术恐慌...

2017年:AI渗入云端
2017年:AI渗入云端

[2017-12-29]  云中的人工智能不仅仅是科技巨头的权力游戏,它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

人工智能民主化能否实现取决于科技巨头
人工智能民主化能否实现取决于科技巨头

[2017-12-29]  我们经常听到像谷歌和微软这样的公司说他们希望人工智能民主化。这是一个很好的词,民主化。 但这些公司如何界定“民主化”还不清楚,像AI本身一样,它似乎有点炒作的味道...

美国Natilus公司试飞水上无人货机 设计简单成本降低
美国Natilus公司试飞水上无人货机 设计简单成本降低

[2017-12-28]  Natilus创业公司成立于2014年,其梦想是建造大型无人机,以半价提供比船舶快得多国际货运。在十二月份,Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出
助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出

[2017-12-25]  本文提出了一个大型的、长序列的、用于行人重识别的视频数据集,简称LVreID。与现有的同类数据集相比,该数据集具有以下特点:1)长序列:平均每段视频序列长为200帧,包含丰......

机器人iCub作为嵌入式AI的标准机器人研究平台的重要性
机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24]  机器人的研究在过去10年中得益于一个具有嵌入式人工智能(AI)的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建,如今在欧洲、美国、韩国、新加坡和日本的实验室......

基于生物启发的机器人很容易适应丢失附属器官
基于生物启发的机器人很容易适应丢失附属器官

[2017-12-17]  很多机器人被设计应用在危险环境,如灾难现场。在这些地方,他们的运动系统完全有可能被损坏。那这样会吓跑这些机器人吗?也许不是,如果它们像日本的东北和北海道大学创造的......

7种常见的机器人焊接类型
7种常见的机器人焊接类型

[2017-12-17]  机器人焊接是工业领域最常见的机器人应用之一,近几十年来主要由汽车行业驱动。机器人焊接在完成大批量,重复性的焊接任务时效率最高。...

农业将为高科技行业 农业机器人的应用领域
农业将为高科技行业 农业机器人的应用领域

[2017-12-17]  农业正在迅速成为一个令人兴奋的高科技产业,吸引了新专业人士,新公司和新投资者。技术发展迅速,不仅提高了农民的生产能力,而且促进了我们所知道的机器人和自动化技术的发展。...