产品中心
技术交流
扫描二维码
Nature:AI新突破!基因编辑进入定制时代
来源:医药魔方Pro
CRISPR-Cas酶已被广泛用于基因组编辑。靶向DNA的Cas核酸酶通过读取原间隔序列相邻基序(protospacer adjacent motifs, PAMs,通常约2-4个核苷酸)来识别基因组靶点,然后启动向导RNA(gRNA)与靶位点配对。对于基因组编辑技术来说,Cas酶的精准定位至关重要。
野生型化脓性链球菌Cas9(SpCas9)是CRISPR-Cas基因编辑系统中最常用的Cas蛋白之一,但其发挥作用需要一个3’端 NGG PAM[“N”代表任意碱基(A、T、C或G),“G”代表鸟嘌呤碱基],这限制了其应用。
过去一些年,业界已经工程改造出了SpCas9变异酶和其它能够识别非典型PAMs(non-canonical PAMs)的54种Cas同源物。这些酶可以分为两大类:1)改变PAM的酶(altered PAM enzymes,即不再偏好NGG PAM);2)放宽PAM的酶(relaxed PAM enzymes,即在能够识别NGG的同时,也能识别其它新的PAMs)。尽管放宽PAM的酶扩展了能够靶向的基因组范围,但也导致了较差的特异性,增加了脱靶编辑的风险。
PAM选择性酶(PAM-selective enzymes)有望实现有效的on-target编辑,同时最大限度地减少脱靶,但很少被开发出来。一个庞大的能够选择性靶向不同PAMs的Cas酶的集合,是实现高效、安全及广泛基因组编辑的最佳解决方案。
来源:Nature
4月22日,最新发表在Nature杂志上的一项研究中,来自Massachusetts General Hospital等机构的科学家团队开发了一种名为PAMmla(PAM ML algorithm)的机器学习算法,可以预测大约6400万种基因组编辑酶的特性。这项工作有助于减少脱靶效应,提高基因编辑安全性及效率,并使研究人员能够预测针对新的治疗靶点的定制酶。
如前文所说,使用CRISPR-Cas9技术的关键要素之一是Cas酶必须定位并结合一个称为PAMs的短DNA序列。在这项研究中,科学家们将高通量蛋白质工程与机器学习(ML)相结合,以获得对特定靶点更具选择性的定制编辑器。
通过基于结构/功能信息的饱和诱变和细菌选择,研究人员获得了近1000个工程SpCas9酶,并表征了它们对PAM的要求,以训练一个神经网络,将氨基酸序列与PAM特异性联系起来。
从氨基酸序列预测SpCas9 PAM偏好的机器学习模型的开发(来源:Nature)
通过利用所开发的PAMmla算法预测6400万个SpCas9酶的PAM,研究鉴定出了一组具有最佳靶向活性和特异性的新型工程Cas9酶。研究人员在人类细胞和色素性视网膜炎小鼠模型中进行了概念验证实验,发现定制的酶具有更高的特异性。
利用PAMmla预测酶进行人类细胞基因组编辑和脱靶分析(来源:Nature)
科学家们表示,这项工作最主要的成果是创建了PAMmla模型,大家可以利用该模型来预测用于其它特定应用的定制酶。研究人员已经制作了一个网络工具(https://pammla.streamlit.app/),允许其他人使用PAMmla模型。
“我们的研究是大大扩展有效、安全CRISPR-Cas9酶库的第一步。在论文中,我们展示了这些PAMmla预测酶在人类原代细胞和小鼠中精确编辑致病序列的实用性。”领导该研究的 Benjamin P. Kleinstiver博士说道。