CRISPR指南设计工具和算法

CRISPR指南设计工具使用最佳实践和最新的计算工具,为人类和小鼠基因组中的每个基因提供最佳的CRISPR RNA (crRNA)或单指南RNA (sgRNA)序列。


CRISPR引导设计算法

每个基因都有大量的候选引导序列(某些基因多达1000个),但确定最佳的引导序列是一项非常困难的任务。在选择用于敲除特定基因的引导序列时,必须考虑许多要求。当前的算法考虑下面描述的需求,然后为每个需求生成分数。然后对目标进行排序,并为每个基因选择最重要的目标。

下面,我们的指南搜索和排名算法的每一步都描述了基本原理和方法。

目标排名

从目标基因组中提取所有具有敲除基因能力的候选靶标,即靶标的切割位点与特定基因的编码区域重叠。例如,我们确定了9,967,686个针对人类基因组编码区(GRCh38)的引导序列。

每个基因的目标首先根据通过特定阈值的特定参数进行排序,通过的参数被赋予最高优先级。参数包括瞄准和脱靶分数,基因内的相对位置,单核苷酸多态性(SNP)概率,以及覆盖的同型异构体的分数(每个参数的描述和评分方法在下一节:参数评分中给出)通过某些阈值,通过的将被赋予最高优先级。各参数的阈值为:

  1. 靶子得分≥0.4
  2. 靶子得分≥0.4
  3. 脱靶评分≥0.67
  4. 相对目标位置≤0.5
  5. SNP概率≤0.05
  6. 覆盖分数> 0.5

注:在某些情况下,没有特定基因的指南满足所有阈值。在这些情况下,通过阈值的重要性排序如下:

SNP概率>分数覆盖>相对目标位置>脱靶得分>目标得分

还生成了特定同种异构体的顶级目标。它们使用上述所有标准,除了覆盖的部分,因为它不再相关。为了获得特定同种异构体的最佳目标,客户应该输入RefSeq同种异构体名称,而不是基因名称。注:仅包含已验证的mRNA和ncRNA (MN和NR)转录本。预测的mRNA和ncRNA (XM和XR)不计算在特定指南将靶向的同种异构体的比例中。

加权平均总体目标分数(范围0 - 1)是根据靶上强度、靶外能力、基因内的相对位置和转录本覆盖的分数来计算的。各参数的权重为:

  1. 相对目标位置:0.4
  2. 覆盖分数:0.4
  3. 命中率:0.1
  4. 脱靶得分:0.1

参数得分

目标的力量

grna的靶向特异性是由引导序列与相应基因组DNA序列的互补性决定的。为了使双链断裂(DSB)发生在导链指定的位置,导链序列和互补DNA序列之间必须发生强相互作用。根据强度的不同,DSB地层成功形成的概率也不同。

对每个目标生成一个非目标得分(得分在0 - 1之间),得分越高表示非目标强度越强。Doench等人(1)给出了确定目标得分的算法。

非目标能力

理想情况下,一个特定的指南将与目标序列具有100%的同源性,并且在基因组的其他地方没有同源性。然而,由于靶序列结合可以容忍多种错配,因此通常存在许多潜在的脱靶位点,其中包含一种或多种错配。

生成脱靶分数(0 - 1),表示脱靶切割的逆概率,分数越高表示脱靶潜力越低。

基因内的相对靶位

切割位点靠近基因n端的靶标更有可能导致功能性基因敲除。这是因为基因开头的移码会比末端的移码破坏更大比例的蛋白质。

相对目标位置是相对于蛋白质编码转录物编码区域的开始(范围0 - 1)进行评分的,其中较低的分数表明向导更靠近基因的n端。

SNP概率

目标与波导的不匹配会显著影响相互作用的强度;即使只有一个错配,也会显著降低引导序列和互补基因组序列之间的相互作用强度,导致切割/编辑效率降低。

SNP概率(范围0 - 1)表示目标序列中至少有一个碱基变异的可能性。目标携带SNP的概率是基于在目标序列中发现的SNP的数量,以及该SNP在人群中的等位基因频率。

注:SNP概率不包括小鼠指南,因为小鼠通常是近亲繁殖的。

覆盖转录本的比例

许多基因编码多种同种异构体。除非在设计工具中指定一个特定的同种异构体作为基因靶标,否则优先选择针对所有或大多数同种异构体的指南。仅包括已验证的mRNA和ncRNA (MN和NR)转录本。预测的mRNA和ncRNA (XM和XR)不计算在特定指南将靶向的同种异构体的比例中。


CRISPR基因组编辑产品和资源

architect™CRISPR-Cas9基因组编辑系统

使用基于rnp的CRISPR- cas9系统克服有效递送和表达CRISPR机制的挑战。architect™使研究人员能够在难以操作的细胞类型(包括干细胞和原代细胞)中进行高效的基因组编辑。

学习更多b>

Wiley电子书:基因组编辑应用

了解使用CRISPR进行下一代疾病建模,包括复杂细胞培养模型的全面基因组编辑策略,优化实验条件的建议以及故障排除提示。

现在下载b>

资源

  • Crisflash提取所有引导位置并识别脱靶(PMID: 30649181)(2)。
  • 方位角确定目标分数(PMID: 26780180)(1)。
  • 基于GRCh38的基因组组装和RefSeq注释。p13 / GRCm38.p6。
  • 利用dbSNP的位置和等位基因频率鉴定的snp构建GCF_000001405.38。
  • 所有其他软件都是内部开发的,是专有的。

参考文献

  1. Doench JG等。优化sgRNA设计,使CRISPR-Cas9的活性最大化,脱靶效应最小化。生物工程学报,34(3):184-91。
  2. Jacquin ALS等。Crisflash:用于生成针对带有个体变异注释的基因组的CRISPR引导rna的开源软件。生物信息学35(17):3146-7。
版权 © 2025 STEMCELL Technologies 技术有限公司。保留所有权利。