CRISPR指南设计工具和算法
CRISPR指南设计工具使用最佳实践和最新的计算工具,为人类和小鼠基因组中的每个基因提供最佳的CRISPR RNA (crRNA)或单指南RNA (sgRNA)序列。
访问CRISPR设计工具
CRISPR引导设计算法
每个基因都有大量的候选引导序列(某些基因多达1000个),但确定最佳的引导序列是一项非常困难的任务。在选择用于敲除特定基因的引导序列时,必须考虑许多要求。当前的算法考虑下面描述的需求,然后为每个需求生成分数。然后对目标进行排序,并为每个基因选择最重要的目标。
下面,我们的指南搜索和排名算法的每一步都描述了基本原理和方法。
目标排名
从目标基因组中提取所有具有敲除基因能力的候选靶标,即靶标的切割位点与特定基因的编码区域重叠。例如,我们确定了9,967,686个针对人类基因组编码区(GRCh38)的引导序列。
每个基因的目标首先根据通过特定阈值的特定参数进行排序,通过的参数被赋予最高优先级。参数包括瞄准和脱靶分数,基因内的相对位置,单核苷酸多态性(SNP)概率,以及覆盖的同型异构体的分数(每个参数的描述和评分方法在下一节:参数评分中给出)通过某些阈值,通过的将被赋予最高优先级。各参数的阈值为:
- 靶子得分≥0.4
- 靶子得分≥0.4
- 脱靶评分≥0.67
- 相对目标位置≤0.5
- SNP概率≤0.05
- 覆盖分数> 0.5
注:在某些情况下,没有特定基因的指南满足所有阈值。在这些情况下,通过阈值的重要性排序如下:
SNP概率>分数覆盖>相对目标位置>脱靶得分>目标得分
还生成了特定同种异构体的顶级目标。它们使用上述所有标准,除了覆盖的部分,因为它不再相关。为了获得特定同种异构体的最佳目标,客户应该输入RefSeq同种异构体名称,而不是基因名称。注:仅包含已验证的mRNA和ncRNA (MN和NR)转录本。预测的mRNA和ncRNA (XM和XR)不计算在特定指南将靶向的同种异构体的比例中。
加权平均总体目标分数(范围0 - 1)是根据靶上强度、靶外能力、基因内的相对位置和转录本覆盖的分数来计算的。各参数的权重为:
- 相对目标位置:0.4
- 覆盖分数:0.4
- 命中率:0.1
- 脱靶得分:0.1
参数得分
目标的力量
grna的靶向特异性是由引导序列与相应基因组DNA序列的互补性决定的。为了使双链断裂(DSB)发生在导链指定的位置,导链序列和互补DNA序列之间必须发生强相互作用。根据强度的不同,DSB地层成功形成的概率也不同。
对每个目标生成一个非目标得分(得分在0 - 1之间),得分越高表示非目标强度越强。Doench等人(1)给出了确定目标得分的算法。
非目标能力
理想情况下,一个特定的指南将与目标序列具有100%的同源性,并且在基因组的其他地方没有同源性。然而,由于靶序列结合可以容忍多种错配,因此通常存在许多潜在的脱靶位点,其中包含一种或多种错配。
生成脱靶分数(0 - 1),表示脱靶切割的逆概率,分数越高表示脱靶潜力越低。
基因内的相对靶位
切割位点靠近基因n端的靶标更有可能导致功能性基因敲除。这是因为基因开头的移码会比末端的移码破坏更大比例的蛋白质。
相对目标位置是相对于蛋白质编码转录物编码区域的开始(范围0 - 1)进行评分的,其中较低的分数表明向导更靠近基因的n端。
SNP概率
目标与波导的不匹配会显著影响相互作用的强度;即使只有一个错配,也会显著降低引导序列和互补基因组序列之间的相互作用强度,导致切割/编辑效率降低。
SNP概率(范围0 - 1)表示目标序列中至少有一个碱基变异的可能性。目标携带SNP的概率是基于在目标序列中发现的SNP的数量,以及该SNP在人群中的等位基因频率。
注:SNP概率不包括小鼠指南,因为小鼠通常是近亲繁殖的。
覆盖转录本的比例
许多基因编码多种同种异构体。除非在设计工具中指定一个特定的同种异构体作为基因靶标,否则优先选择针对所有或大多数同种异构体的指南。仅包括已验证的mRNA和ncRNA (MN和NR)转录本。预测的mRNA和ncRNA (XM和XR)不计算在特定指南将靶向的同种异构体的比例中。
CRISPR基因组编辑产品和资源
资源
- Crisflash提取所有引导位置并识别脱靶(PMID: 30649181)(2)。
- 方位角确定目标分数(PMID: 26780180)(1)。
- 基于GRCh38的基因组组装和RefSeq注释。p13 / GRCm38.p6。
- 利用dbSNP的位置和等位基因频率鉴定的snp构建GCF_000001405.38。
- 所有其他软件都是内部开发的,是专有的。
参考文献
- Doench JG等。优化sgRNA设计,使CRISPR-Cas9的活性最大化,脱靶效应最小化。生物工程学报,34(3):184-91。
- Jacquin ALS等。Crisflash:用于生成针对带有个体变异注释的基因组的CRISPR引导rna的开源软件。生物信息学35(17):3146-7。