本公开提供了已被修饰以表现出增强的特异性(或保真度)的cas9蛋白,包括涉及此类cas9蛋白的组合物、多核苷酸、载体、细胞和试剂盒。本公开还提供了在广泛的临床环境(例如,治疗和诊断两者)中产生并使用经修饰的cas9蛋白的方法。
背景技术:
1、基因编辑技术已经成为一种强大而通用的技术,具有广泛的临床应用潜力。特别地,研究人员已使用crispr-cas系统成功地使多种细胞类型和物种中的基因失效或修复。尽管取得了此类进展,脱靶事件仍然是一个主要问题并且已阻碍了crispr-cas系统跨靶标和疾病状态的广泛适用性。参见例如,jinek等人,science 337:816-821(2012);以及fu等人,nature biotechnology 31:822-826(2013)。
2、通过使用蛋白质工程化,传统cas蛋白(例如,酿脓链球菌(streptococcuspyogenes)cas9(spcas9))的特异性得到改善。例如,与野生型spcas9蛋白相比,espcas和hf-spcas9蛋白提供大得多的特异性。参见例如,slaymaker等人,science 351:84-88(2016);以及kleinstiver等人,nature 529:490-495(2016)。然而,仍然以显著的频率观察到脱靶效应,特别是在基因编辑过程期间存在单碱基错配的情况下。特别地,当使用crispr进行体外切割时,不像在细胞中那样存在修复机制,所以dna一旦受损就不会被修复,并且甚至在错配断裂时也没有例外。因此,在体外切割条件下,错配切割变得更加显著,并且现有crispr-cas系统的限制变得更加明显。
3、因此,仍然需要改进的cas9蛋白,其在基因编辑期间允许更大的特异性和减少的脱靶效应。
技术实现思路
1、本文提供了一种包含腔结构域的cas9蛋白,该腔结构域包含多个带正电荷的氨基酸,其中该多个带正电荷的氨基酸中的至少一者与对应野生型cas9蛋白相比被修饰(“氨基酸修饰”),并且其中该氨基酸修饰能够增加cas9蛋白的特异性。
2、在一些方面,腔结构域的多个带正电荷的氨基酸包含二、三、四、五、六、七、八、九、10、11或更多个氨基酸修饰。在一些方面,cas9蛋白包含seq id no:1的氨基酸序列,并且其中氨基酸修饰在seq id no:1的以下残基中的一者或多者处:r785、k789、r455、r721、r919、r1241、r939、k1189、k941、r1226、k1228、或它们的组合。在一些方面,氨基酸修饰在残基r785、k1189、r1241或它们的组合处。在一些方面,氨基酸修饰在残基k1189和r1241处。在一些方面,氨基酸修饰在残基r785、k1189和r1241处。
3、本文提供了一种包含具有至少一个氨基酸修饰的seq id no:1中所示的氨基酸序列的cas9蛋白,其中该至少一个氨基酸修饰在seq id no:1的残基k405、r455、k546、k561、k562、k564、k566、k578、k579、r618、r622、k664、r721、r785、k786、k788、k789、r807、k808、r849、r856、k914、k917、r919、r920、k921、k922、r926、k934、k936、r939、k941、k945、r1047、r1131、r1137、k1142、k1152、k1155、r1178、k1189、k1198、k1206、k1213、k1223、r1226、k1227、k1228、r1241、或它们的组合处。
4、在一些方面,该至少一个氨基酸修饰在seq id no:1的残基k405、r455、k566、k578、k664、r721、r785、k786、k789、k914、k917、r919、k921、k922、r926、k934、k936、r939、k941、k945、r1137、k1142、k1152、k1189、k1198、k1206、k1223、r1226、k1227、k1228、r1241或它们的组合处。在一些方面,该至少一个氨基酸修饰在seq id no:1的残基r455、r785、r721、k789、r919、r1241、r939、k941、k1189、r1226、k1228或它们的组合处。在一些方面,氨基酸修饰在seq id no:1的残基k1189或r1241处。在一些方面,氨基酸修饰在以下残基处:(i)seq id no:1的k1189和r1241;(ii)seq id no:1的r721和r1241;或(iii)seq id no:1的r785和r1241。在一些方面,氨基酸修饰在以下残基处:(i)seq id no:1的r785、k1189和r1241;(ii)seq id no:1的r721、k1189和r1241;或(iii)seq id no:1的k1189、k1228和r1241。
5、对于本文所述的包含至少一个氨基酸修饰的cas9蛋白中的任一种,在一些方面,氨基酸修饰包括丙氨酸取代。
6、本公开提供了一种cas9蛋白,其包含seq id no:2中所示的氨基酸序列、由其组成、或基本上由其组成。本文还提供了一种cas9蛋白,其包含seq id no:3中所示的氨基酸序列、由其组成、或基本上由其组成。本文还提供了一种cas9蛋白,其包含seq id no:4中所示的氨基酸序列、由其组成、或基本上由其组成。本文还提供了一种cas9蛋白,其包含seqid no:5中所示的氨基酸序列、由其组成、或基本上由其组成。本文提供了一种cas9蛋白,其包含seq id no:6中所示的氨基酸序列、由其组成、或基本上由其组成。本文提供了一种cas9蛋白,其包含seq id no:7中所示的氨基酸序列、由其组成、或基本上由其组成。本文提供了一种cas9蛋白,其包含seq id no:8中所示的氨基酸序列、由其组成、或基本上由其组成。本文提供了一种cas9蛋白,其包含seq id no:9中所示的氨基酸序列、由其组成、或基本上由其组成。
7、本公开还提供了包含本公开的cas9蛋白中的任一种的组合物。在一些方面,该组合物还包含引导多核苷酸。在一些方面,该引导多核苷酸包括单引导rna(sgrna)。
8、本文提供了一种编码本公开的cas9蛋白中的任一种的分离的多核苷酸。本文还提供了一种包含分离的多核苷酸的载体。本文还提供了一种包含载体的细胞。
9、本文还公开了一种包括本公开的cas9蛋白中的任一种和使用说明书的试剂盒。在一些方面,该试剂盒还包括引导多核苷酸。在一些方面,该引导多核苷酸包括单引导rna(sgrna)。
10、本公开提供了一种富集生物样品中的第一核苷酸序列的方法,该生物样品包含第一核苷酸序列和第二核苷酸序列,该方法包括使该生物样品与本公开的cas9蛋白中的任一种接触,其中该第一核苷酸序列包含突变并且该第二核苷酸序列不包含突变,并且其中该cas9蛋白能够识别该突变并且由此切割第二核苷酸序列但不切割第一核苷酸序列。
11、在一些方面,在接触之后,生物样品中存在的第一核苷酸序列的百分比与参考样品(例如,接触之前的生物样品)中存在的第一核苷酸序列的百分比相比增加至少约1倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约10倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约40倍或至少约50倍。在一些方面,在接触之后,生物样品中存在的第二核苷酸序列的量与参考样品(例如,接触之前的生物样品)中存在的第二核苷酸序列的量相比减少至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或至少约100%。在一些方面,在接触之后,生物样品中存在的至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、或约100%的核苷酸分子包含第一核苷酸序列。
12、本文还提供了一种测量生物样品中包含突变的第一核苷酸序列的量的方法,该方法包括使该生物样品与本公开的cas9蛋白中的任一种接触,其中该接触减少该生物样品中存在的第二核苷酸序列的量,并且其中该第二核苷酸序列不包含突变。
13、在一些方面,第一核苷酸序列和第二核苷酸序列除了该突变之外是相同的。在一些方面,突变包括取代、插入、缺失、缺失-插入(indel)、重复、倒位、大基因组重排或它们的组合。
14、在一些方面,第一核苷酸序列包含单个突变。在一些方面,第一核苷酸序列包含多个突变。在存在多个突变的情况下,在一些方面,该多个突变中的每一者是相同的。在一些方面,该多个突变中的两者或更多者是不同的。
15、在一些方面,该突变在以下项内:(i)引导多核苷酸所结合的靶位点,(ii)原型间隔区相邻基序(pam),或(iii)(i)和(ii)两者。
16、在一些方面,生物样品获自患有疾病或具有增加的发展疾病的风险的受试者。在一些方面,该突变与该疾病相关。
17、在一些方面,第一核苷酸序列包括循环肿瘤dna(ctdna),并且其中第二核苷酸序列包括非ctdna。
18、本公开还提供了一种诊断有需要的受试者的疾病的方法,该方法包括检测从该受试者获得的生物样品中包含与该疾病相关的突变的核苷酸序列的量与参考样品(例如,从未患有该疾病的受试者获得的生物样品)中存在的对应量相比是否增加,其中在检测之前,使该生物样品与本文所述的cas9蛋白中的任一种接触。
19、在一些方面,如果在该生物样品中包含突变的核苷酸序列的量与参考样品中存在的对应量相比增加,则该受试者具有该疾病或处于发展该疾病的风险中。在一些方面,与参考样品中存在的对应量相比,生物样品中包含突变的核苷酸序列的量增加至少约1倍、至少约5倍、至少约10倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约40倍或至少约50倍。
20、在一些方面,诊断是离体进行的。
21、在一些方面,该疾病包括癌症、血液疾病、神经变性/神经疾病、感染性疾病、类风湿性疾病、变应性疾病、精神疾病、眼科疾病、内分泌疾病、先天性疾病、心血管疾病、肺病、肾病、胃病、肝病或它们的组合。在一些方面,该癌症包括肺癌(例如,非小细胞肺癌)、乳腺癌、胰腺癌、胆管癌、胆囊癌、肝癌、结肠直肠癌、肾癌、前列腺癌、胃癌、卵巢癌、子宫癌、宫颈癌、肌肉骨骼癌或它们的组合。在一些方面,神经变性/神经疾病包括阿尔茨海默病、帕金森病、肌萎缩性侧索硬化、弗里德赖希氏共济失调、亨廷顿氏病、路易体病、脊髓性肌萎缩、中风或它们的组合。
22、本文提供了一种在基于crispr的基因编辑期间降低核酸序列的脱靶切割的发生的方法,其包括使该核酸序列与包含cas9蛋白和引导多核苷酸的复合物接触,其中该cas9蛋白包含能够增加cas9蛋白的特异性的氨基酸修饰,由此减少脱靶切割的发生。在一些方面,cas9蛋白包括本公开的cas9蛋白中的任一种。
23、在一些方面,与用参考cas9蛋白的脱靶切割的发生相比,脱靶切割的发生减少至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或至少约100%。在一些方面,参考cas9蛋白包括不包含氨基酸修饰的对应cas9蛋白。在一些方面,参考cas9蛋白包含seq id no:244、seq id no:1、seq id no:245、seq id no:246、seq id no:247或seq id no:248中任一项中所示的氨基酸序列。
24、本文公开了一种增加cas9蛋白的特异性的方法,其包括修饰该cas9蛋白的至少一个氨基酸残基,其中该至少一个氨基酸残基能够与dna序列的骨架磷酸相互作用。
25、在一些方面,被修饰的该至少一个氨基酸残基包括对应于seq id no:1中所示的氨基酸序列的残基k405、r455、k546、k561、k562、k564、k566、k578、k579、r618、r622、k664、r721、r785、k786、k788、k789、r807、k808、r849、r856、k914、k917、r919、r920、k921、k922、r926、k934、k936、r939、k941、k945、r1047、r1131、r1137、k1142、k1152、k1155、r1178、k1189、k1198、k1206、k1213、k1223、r1226、k1227、k1228、r1241或它们的组合。在一些方面,被修饰的该至少一个氨基酸残基包括对应于seq id no:1中所示的氨基酸序列的残基k405、r455、k566、k578、k664、r721、r785、k786、k789、k914、k917、r919、k921、k922、r926、k934、k936、r939、k941、k945、r1137、k1142、k1152、k1189、k1198、k1206、k1223、r1226、k1227、k1228、r1241或它们的组合。在一些方面,被修饰的该至少一个氨基酸残基包括对应于seq id no:1中所示的氨基酸序列的残基r455、r785、r721、k789、r919、r1241、r939、k941、k1189、r1226、k1228或它们的组合。在一些方面,被修饰的该至少一个氨基酸残基包括对应于seq id no:1的k1189或r1241。在一些方面,被修饰的该至少一个氨基酸残基包括:对应于seq id no:1的(i)k1189和r1241;(ii)r721和r1241;(iii)r785和r1241;或(iv)k1189和r1241。在一些方面,被修饰的该至少一个氨基酸残基包括:对应于seq id no:1的(i)r785、k1189和r1241;(ii)r721、k1189和r1241;或(iii)k1189、k1228和r1241。
26、在一些方面,氨基酸修饰包括丙氨酸取代。
27、在一些方面,在修饰之后,与参考cas9蛋白的特异性相比,cas9蛋白的选择性增加至少约1倍、至少约5倍、至少约10倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约40倍或至少约50倍。在一些方面,参考cas9蛋白包括不包含氨基酸修饰的对应cas9蛋白。在一些方面,参考cas9蛋白包含seq id no:244、seq id no:1、seq id no:245、seq idno:246、seq id no:247或seq id no:248中任一项中所示的氨基酸序列。
28、在一些方面,在修饰之后,cas9蛋白能够区别包含突变的第一核苷酸序列和不包含突变的第二核苷酸序列,使得cas9蛋白切割第二核苷酸序列但不切割第一核苷酸序列。在一些方面,该突变在以下项内:(i)引导多核苷酸所结合的靶位点,(ii)原型间隔区相邻基序(pam),或(iii)两者。
29、本文提供了一种遗传修饰细胞的方法,其包括使细胞与本公开的cas9蛋白中的任一种接触,其中该接触导致该细胞的一个或多个dna序列的修饰。在一些方面,该细胞包括真核细胞、酵母细胞、植物细胞、哺乳动物细胞或它们的组合。
1.一种包含腔结构域的cas9蛋白,所述腔结构域包含多个带正电荷的氨基酸,其中所述多个带正电荷的氨基酸中的至少一者与对应野生型cas9蛋白相比被修饰(“氨基酸修饰”),并且其中所述氨基酸修饰能够增加所述cas9蛋白的特异性。
2.如权利要求1所述的cas9蛋白,其中所述腔结构域的所述多个带正电荷的氨基酸包含两个、三个、四个、五个、六个、七个、八个、九个、10个、11个或更多个氨基酸修饰。
3.如权利要求1或2所述的cas9蛋白,其包含seq id no:1的氨基酸序列,并且其中所述氨基酸修饰在seq id no:1的以下残基中的一者或多者处:r785、k789、r455、r721、r919、r1241、r939、k1189、k941、r1226、k1228或它们的组合。
4.如权利要求3所述的cas9蛋白,其中所述氨基酸修饰在残基r785、k1189、r1241或它们的组合处。
5.如权利要求3或4所述的cas9蛋白,其中所述氨基酸修饰在残基k1189和r1241处。
6.如权利要求3或4所述的cas9蛋白,其中所述氨基酸修饰在残基r785、k1189和r1241处。
7.一种cas9蛋白,其包含具有至少一个氨基酸修饰的seq id no:1中所示的氨基酸序列,其中所述至少一个氨基酸修饰在seq id no:1的残基k405、r455、k546、k561、k562、k564、k566、k578、k579、r618、r622、k664、r721、r785、k786、k788、k789、r807、k808、r849、r856、k914、k917、r919、r920、k921、k922、r926、k934、k936、r939、k941、k945、r1047、r1131、r1137、k1142、k1152、k1155、r1178、k1189、k1198、k1206、k1213、k1223、r1226、k1227、k1228、r1241或它们的组合处。
8.如权利要求7所述的cas9蛋白,其中所述至少一个氨基酸修饰在seq id no:1的残基k405、r455、k566、k578、k664、r721、r785、k786、k789、k914、k917、r919、k921、k922、r926、k934、k936、r939、k941、k945、r1137、k1142、k1152、k1189、k1198、k1206、k1223、r1226、k1227、k1228、r1241或它们的组合处。
9.如权利要求7或8所述的cas9蛋白,其中所述至少一个氨基酸修饰在seq id no:1的残基r455、r785、r721、k789、r919、r1241、r939、k941、k1189、r1226、k1228或它们的组合处。
10.如权利要求7至9中任一项所述的cas9蛋白,其中所述氨基酸修饰在seq id no:1的残基k1189或r1241处。
11.如权利要求7至9中任一项所述的cas9蛋白,其中所述氨基酸修饰在以下残基处:(i)seq id no:1的k1189和r1241;(ii)seq id no:1的r721和r1241;或(iii)seq id no:1的r785和r1241。
12.如权利要求7至9中任一项所述的cas9蛋白,其中所述氨基酸修饰在以下残基处:(i)seq id no:1的r785、k1189和r1241;(ii)seq id no:1的r721、k1189和r1241;或(iii)seq id no:1的k1189、k1228和r1241。
13.如权利要求1至12中任一项所述的cas9蛋白,其中所述氨基酸修饰包括丙氨酸取代。
14.一种cas9蛋白,其包含seq id no:2中所示的氨基酸序列、由其组成、或基本上由其组成。
15.一种cas9蛋白,其包含seq id no:3中所示的氨基酸序列、由其组成、或基本上由其组成。
16.一种cas9蛋白,其包含seq id no:4中所示的氨基酸序列、由其组成、或基本上由其组成。
17.一种cas9蛋白,其包含seq id no:5中所示的氨基酸序列、由其组成、或基本上由其组成。
18.一种cas9蛋白,其包含seq id no:6中所示的氨基酸序列、由其组成、或基本上由其组成。
19.一种cas9蛋白,其包含seq id no:7中所示的氨基酸序列、由其组成、或基本上由其组成。
20.一种cas9蛋白,其包含seq id no:8中所示的氨基酸序列、由其组成、或基本上由其组成。
21.一种cas9蛋白,其包含seq id no:9中所示的氨基酸序列、由其组成、或基本上由其组成。
22.一种组合物,其包含如权利要求1至21中任一项所述的cas9蛋白。
23.如权利要求22所述的组合物,其还包含引导多核苷酸。
24.如权利要求23所述的组合物,其中所述引导多核苷酸包括单引导rna(sgrna)。
25.一种分离的多核苷酸,其编码如权利要求1至21中任一项所述的cas9蛋白。
26.一种载体,其包含如权利要求25所述的分离的多核苷酸。
27.一种细胞,其包含如权利要求26所述的载体。
28.一种试剂盒,其包括如权利要求1至21中任一项所述的cas9蛋白和使用说明书。
29.如权利要求28所述的试剂盒,其还包括引导多核苷酸。
30.如权利要求29所述的试剂盒,其中所述引导多核苷酸包括单引导rna(sgrna)。
31.一种富集生物样品中的第一核苷酸序列的方法,所述生物样品包含所述第一核苷酸序列和第二核苷酸序列,所述方法包括使所述生物样品与如权利要求1至21中任一项所述的cas9蛋白接触,其中所述第一核苷酸序列包含突变并且所述第二核苷酸序列不包含所述突变,并且其中所述cas9蛋白能够识别所述突变并由此切割所述第二核苷酸序列但不切割所述第一核苷酸序列。
32.如权利要求31所述的方法,其中在所述接触之后,所述生物样品中存在的所述第一核苷酸序列的百分比与参考样品(例如,所述接触之前的所述生物样品)中存在的所述第一核苷酸序列的百分比相比增加至少约1倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约10倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约40倍或至少约50倍。
33.如权利要求31或32所述的方法,其中在所述接触之后,所述生物样品中存在的所述第二核苷酸序列的量与参考样品(例如,所述接触之前的所述生物样品)中存在的所述第二核苷酸序列的量相比减少至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或至少约100%。
34.如权利要求31至33中任一项所述的方法,其中在所述接触之后,所述生物样品中存在的至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%的核苷酸分子包含所述第一核苷酸序列。
35.一种测量生物样品中包含突变的第一核苷酸序列的量的方法,所述方法包括使所述生物样品与如权利要求1至21中任一项所述的cas9蛋白接触,其中所述接触使所述生物样品中存在的第二核苷酸序列的量减少,并且其中所述第二核苷酸序列不包含所述突变。
36.如权利要求31至35中任一项所述的方法,其中所述第一核苷酸序列和所述第二核苷酸序列除了所述突变外是相同的。
37.如权利要求31至36中任一项所述的方法,其中所述突变包括取代、插入、缺失、缺失-插入(indel)、复制、倒位、大基因组重排或它们的组合。
38.如权利要求31至37中任一项所述的方法,其中所述第一核苷酸序列包含单个突变。
39.如权利要求31至37中任一项所述的方法,其中所述第一核苷酸序列包含多个突变。
40.如权利要求39所述的方法,其中所述多个突变中的每一者是相同的。
41.如权利要求39所述的方法,其中所述多个突变中的两者或更多者是不同的。
42.如权利要求31至41中任一项所述的方法,其中所述突变在以下项内:(i)引导多核苷酸所结合的靶位点,(ii)原型间隔区相邻基序(pam),或(iii)(i)和(ii)两者。
43.如权利要求31至42中任一项所述的方法,其中所述生物样品获自患有疾病或具有增加的发展疾病风险的受试者。
44.如权利要求43所述的方法,其中所述突变与所述疾病相关。
45.如权利要求31至44中任一项所述的方法,其中所述第一核苷酸序列包含循环肿瘤dna(ctdna)并且其中所述第二核苷酸序列包含非ctdna。
46.一种诊断有需要的受试者的疾病的方法,所述方法包括检测从所述受试者获得的生物样品中包含与所述疾病相关的突变的核苷酸序列的量与参考样品(例如,从未患有所述疾病的受试者获得的生物样品)中存在的对应量相比是否增加,其中在所述检测之前,使所述生物样品与如权利要求1至21中任一项所述的cas9蛋白接触。
47.如权利要求46所述的方法,其中如果所述生物样品中包含所述突变的所述核苷酸序列的所述量与所述参考样品中存在的所述对应量相比增加,则所述受试者患有所述疾病或处于发展所述疾病的风险中。
48.如权利要求47所述的方法,其中所述生物样品中包含所述突变的所述核苷酸序列的所述量与所述参考样品中存在的所述对应量相比增加至少约1倍、至少约5倍、至少约10倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约40倍或至少约50倍。
49.如权利要求46至48中任一项所述的方法,其中所述诊断是离体进行的。
50.如权利要求46至49中任一项所述的方法,其中所述疾病包括癌症、血液疾病、神经变性/神经疾病、感染性疾病、类风湿性疾病、变应性疾病、精神疾病、眼科疾病、内分泌疾病、先天性疾病、心血管疾病、肺病、肾病、胃病、肝病或它们的组合。
51.如权利要求50所述的方法,其中所述癌症包括肺癌(例如,非小细胞肺癌)、乳腺癌、胰腺癌、胆管癌、胆囊癌、肝癌、结肠直肠癌、肾癌、前列腺癌、胃癌、卵巢癌、子宫癌、宫颈癌、肌肉骨骼癌或它们的组合。
52.如权利要求50所述的方法,其中所述神经变性/神经疾病包括阿尔茨海默病、帕金森病、肌萎缩性侧索硬化、弗里德赖希氏共济失调、亨廷顿氏病、路易体病、脊髓性肌萎缩、中风或它们的组合。
53.一种在基于crispr的基因编辑期间减少核酸序列的脱靶切割的发生的方法,其包括使所述核酸序列与包含cas9蛋白和引导多核苷酸的复合物接触,其中所述cas9蛋白包含能够增加所述cas9蛋白的特异性的氨基酸修饰,由此减少脱靶切割的发生。
54.如权利要求53所述的方法,其中所述cas9蛋白包括如权利要求1至21中任一项所述的cas9蛋白。
55.如权利要求53或54所述的方法,其中脱靶切割的发生与用参考cas9蛋白的脱靶切割的发生相比减少至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或至少约100%。
56.如权利要求55所述的方法,其中所述参考cas9蛋白包括不包含所述氨基酸修饰的对应cas9蛋白。
57.如权利要求55或56所述的方法,其中所述参考cas9蛋白包含seq id no:244、seqid no:1、seq id no:245、seq id no:246、seq id no:247或seq id no:248中任一项中所示的氨基酸序列。
58.一种增加cas9蛋白的特异性的方法,其包括修饰所述cas9蛋白的至少一个氨基酸残基,其中所述至少一个氨基酸残基能够与dna序列的骨架磷酸相互作用。
59.如权利要求58所述的方法,其中被修饰的所述至少一个氨基酸残基包括对应于seqid no:1中所示的氨基酸序列的残基k405、r455、k546、k561、k562、k564、k566、k578、k579、r618、r622、k664、r721、r785、k786、k788、k789、r807、k808、r849、r856、k914、k917、r919、r920、k921、k922、r926、k934、k936、r939、k941、k945、r1047、r1131、r1137、k1142、k1152、k1155、r1178、k1189、k1198、k1206、k1213、k1223、r1226、k1227、k1228、r1241或它们的组合。
60.如权利要求58或59所述的方法,其中被修饰的所述至少一个氨基酸残基包括对应于seq id no:1中所示的氨基酸序列的残基k405、r455、k566、k578、k664、r721、r785、k786、k789、k914、k917、r919、k921、k922、r926、k934、k936、r939、k941、k945、r1137、k1142、k1152、k1189、k1198、k1206、k1223、r1226、k1227、k1228、r1241或它们的组合。
61.如权利要求59或60所述的方法,其中被修饰的所述至少一个氨基酸残基包括对应于seq id no:1中所示的氨基酸序列的残基r455、r785、r721、k789、r919、r1241、r939、k941、k1189、r1226、k1228或它们的组合。
62.如权利要求58至61中任一项所述的方法,其中被修饰的所述至少一个氨基酸残基包括对应于seq id no:1的k1189或r1241。
63.如权利要求58至61中任一项所述的方法,其中被修饰的所述至少一个氨基酸残基包括:对应于seq id no:1的(i)k1189和r1241;(ii)r721和r1241;(iii)r785和r1241;或(iv)k1189和r1241。
64.如权利要求58至61中任一项所述的方法,其中被修饰的所述至少一个氨基酸残基包括:对应于seq id no:1的(i)r785、k1189和r1241;(ii)r721、k1189和r1241;或(iii)k1189、k1228和r1241。
65.如权利要求58至64中任一项所述的方法,其中所述氨基酸修饰包括丙氨酸取代。
66.如权利要求58至65中任一项所述的方法,其中在所述修饰之后,所述cas9蛋白的选择性与参考cas9蛋白的特异性相比增加至少约1倍、至少约5倍、至少约10倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约40倍或至少约50倍。
67.如权利要求66所述的方法,其中所述参考cas9蛋白包括不包含所述氨基酸修饰的对应cas9蛋白。
68.如权利要求66或67所述的方法,其中所述参考cas9蛋白包含seq id no:244、seqid no:1、seq id no:245、seq id no:246、seq id no:247或seq id no:248中任一项中所示的氨基酸序列。
69.如权利要求58至68中任一项所述的方法,其中在所述修饰之后,所述cas9蛋白能够区别包含突变的第一核苷酸序列和不包含所述突变的第二核苷酸序列,使得所述cas9蛋白切割所述第二核苷酸序列但不切割所述第一核苷酸序列。
70.如权利要求69所述的方法,其中所述突变在以下项内:(i)引导多核苷酸所结合的靶位点,(ii)原型间隔区相邻基序(pam),或(iii)(i)和(ii)两者。
71.一种遗传修饰细胞的方法,其包括使细胞与如权利要求1至21中任一项所述的cas9蛋白接触,其中所述接触导致所述细胞的一个或多个dna序列的修饰。
72.如权利要求71所述的方法,其中所述细胞包括真核细胞、酵母细胞、植物细胞、哺乳动物细胞或它们的组合。