研究背景
CRISPR-Cas9是一种强大的基因编辑工具,其具有广泛的应用,包括生物学研究、疾病治疗等。然而,CRISPR-Cas9系统的一个主要挑战是其"靶向特异性"问题,即尽管理想情况下CRISPR系统应只剪切目标基因,但实际上它可能会误剪其他基因,产生所谓的"脱靶效应",这可能导致预期外的基因突变,甚至可能引发疾病。
为了解决这个问题,科学家们已经开发了一些计算工具来预测CRISPR系统的脱靶效应。然而,现有的计算工具在全基因组范围内预测脱靶效应的性能有限,这主要是因为对CRISPR分子机制的深入理解不足。因此,开发新的方法去理解和预测CRISPR的脱靶效应成为了一个重要的研究方向。
2023年11月18日,Nature Communications在线发表了同济大学刘琦团队、罗氏中国创新中心Qing Zhang、中国农业科学院农业基因组研究所左二伟团队合作的研究成果:‘Genome-wide CRISPR off-target prediction and optimization using RNA-DNA interaction fingerprints’,这篇文章介绍了一种新的预测脱靶的工具——CRISOT,该工具结合了深度学习和分子动力学模拟技术,用以预测CRISPR-Cas9系统中RNA与DNA之间的相互作用,以优化CRISPR的靶向特异性和减少其脱靶效应。这种新方法可以更深入地理解CRISPR分子机制,有助于改进基因编辑的精确性和效率。
CRISOT包含四个模块:CRISOT-FP、CRISOT-Score、CRISOT-Spec和CRISOT-Opti。CRISOT-FP 用于产生RNA-DNA分子交互指纹;CRISOT-Score用于预测基因组范围内的CRISPR靶向位点的可能性;CRISOT-Spec用于评估sgRNA的特异性;CRISOT-Opti用于优化sgRNA设计,以提高其靶向特异性并减少其脱靶效应。
通过对照实验和计算机模拟,研究者发现CRISOT在预测CRISPR-Cas9的全基因组范围内的靶向和脱靶效应方面表现出优越的性能。此外,CRISOT还能够准确预测基因编辑的碱基编辑器和引导编辑器的脱靶效应。
CRISOT为全基因组范围内的CRISPR脱靶预测、评价和sgRNA优化提供了一个有效且可泛化的框架,为改进CRISPR基因编辑的靶向特异性提供了重要工具。

CRISOT工具的概念框架和工作流程:
CRISPR-Cas9系统中RNA-DNA杂交体具有重要的作用,通过分子动力学模拟可以理解RNA-DNA杂交体在原子级别的分子相互作用的基本概念。(图1 a)
从分子动力学模拟中提取的RNA-DNA分子交互特征,包括氢键、结合自由能、原子位置(原子-原子距离、角度和二面角)以及碱基对/碱基步长的几何特征。(图1 b)
将这些分子交互特征编码为RNA-DNA分子交互指纹(CRISOT-FP),并使用它来训练XGBoost分类模型,用于预测CRISPR的脱靶效应。(图1 c)
基于CRISOT-FP的三个模块的工作原理:CRISOT-Score用于快速计算给定sgRNA和脱靶序列的得分;CRISOT-Spec用于计算给定sgRNA的特异性得分,汇总所有可能脱靶位点的CRISOT-Score得分;CRISOT-Opti用于sgRNA优化,通过引入单核苷酸突变来减少给定sgRNA的脱靶效应,同时保持其靶向效应。(图1 d-f)
CRISPR-Cas9是一种强大的基因编辑工具,其具有广泛的应用,包括生物学研究、疾病治疗等。然而,CRISPR-Cas9系统的一个主要挑战是其"靶向特异性"问题,即尽管理想情况下CRISPR系统应只剪切目标基因,但实际上它可能会误剪其他基因,产生所谓的"脱靶效应",这可能导致预期外的基因突变,甚至可能引发疾病。
为了解决这个问题,科学家们已经开发了一些计算工具来预测CRISPR系统的脱靶效应。然而,现有的计算工具在全基因组范围内预测脱靶效应的性能有限,这主要是因为对CRISPR分子机制的深入理解不足。因此,开发新的方法去理解和预测CRISPR的脱靶效应成为了一个重要的研究方向。
2023年11月18日,Nature Communications在线发表了同济大学刘琦团队、罗氏中国创新中心Qing Zhang、中国农业科学院农业基因组研究所左二伟团队合作的研究成果:‘Genome-wide CRISPR off-target prediction and optimization using RNA-DNA interaction fingerprints’,这篇文章介绍了一种新的预测脱靶的工具——CRISOT,该工具结合了深度学习和分子动力学模拟技术,用以预测CRISPR-Cas9系统中RNA与DNA之间的相互作用,以优化CRISPR的靶向特异性和减少其脱靶效应。这种新方法可以更深入地理解CRISPR分子机制,有助于改进基因编辑的精确性和效率。
CRISOT包含四个模块:CRISOT-FP、CRISOT-Score、CRISOT-Spec和CRISOT-Opti。CRISOT-FP 用于产生RNA-DNA分子交互指纹;CRISOT-Score用于预测基因组范围内的CRISPR靶向位点的可能性;CRISOT-Spec用于评估sgRNA的特异性;CRISOT-Opti用于优化sgRNA设计,以提高其靶向特异性并减少其脱靶效应。
通过对照实验和计算机模拟,研究者发现CRISOT在预测CRISPR-Cas9的全基因组范围内的靶向和脱靶效应方面表现出优越的性能。此外,CRISOT还能够准确预测基因编辑的碱基编辑器和引导编辑器的脱靶效应。
CRISOT为全基因组范围内的CRISPR脱靶预测、评价和sgRNA优化提供了一个有效且可泛化的框架,为改进CRISPR基因编辑的靶向特异性提供了重要工具。

CRISOT工具的概念框架和工作流程:
CRISPR-Cas9系统中RNA-DNA杂交体具有重要的作用,通过分子动力学模拟可以理解RNA-DNA杂交体在原子级别的分子相互作用的基本概念。(图1 a)
从分子动力学模拟中提取的RNA-DNA分子交互特征,包括氢键、结合自由能、原子位置(原子-原子距离、角度和二面角)以及碱基对/碱基步长的几何特征。(图1 b)
将这些分子交互特征编码为RNA-DNA分子交互指纹(CRISOT-FP),并使用它来训练XGBoost分类模型,用于预测CRISPR的脱靶效应。(图1 c)
基于CRISOT-FP的三个模块的工作原理:CRISOT-Score用于快速计算给定sgRNA和脱靶序列的得分;CRISOT-Spec用于计算给定sgRNA的特异性得分,汇总所有可能脱靶位点的CRISOT-Score得分;CRISOT-Opti用于sgRNA优化,通过引入单核苷酸突变来减少给定sgRNA的脱靶效应,同时保持其靶向效应。(图1 d-f)