第四节 目的基因序列的来源和分离
一、基因组DNA文库
从生物组织细胞提取出全部DNA,用物理方法(超声波、搅拌剪力等)或酶法(限制性核酸内切酶的不完全酶解)将DNA降解成预期大小的片段,然后将这些片段与适当的载体(常用噬菌体、粘粒或YAC载体)连接,转入受体细菌或细胞,这样每一个细胞接受了含有一个基因组DNA片段与载体连接的重组DNA分子,而且可以繁殖扩增,许多细胞一起组成一个含有基因组各DNA片段克隆的集合体,就称为基因组DNA文库(genomic DNA library)。如果这个文库足够大,能包含该生物基因组DNA全部的序列,就是该生物完整的基因组文库,能从这文库中钓取该生物的全部基因或DNA序列。从基因组含有生物生存、活动和繁殖的全部遗传信息的概念出发,基因组文库是具有生物种属特异性的。
构建基因组文库,再用分子杂交等技术去钓取基因克隆的方法,称为鸟枪法或散弹射击法,意味着从含有众多的基因序列克隆群中去获取目的基因或序列。当生物基因组比较小时,此法较易成功;当生物基因组很大时,构建其完整的基因组文库就非易事,从庞大的文库中去克隆目的基因工程量也很大。
图20-8 基因组DNA文库的构建
二、cDNA文库
以mRNA为模板,经反转录酶催化合成DNA,则此DNA序列与mRNA互补,称为互补DNA或cDNA。提取出组织细胞的全部mRNA,在体外反转录成cDNA,与适当的载体常用噬菌体或质粒载体连接后转化受体菌,则每个细菌含有一段cDNA,并能繁殖扩增,这样包含着细胞全部mRNA信息的cDNA克隆集合称为该组织细胞的cDNA文库,基因组含有的基因在特定的组织细胞中只有一部分表达,而且处在不同环境条件、不同分化时期的细胞其基因表达的种类和强度也不尽相同,所以cDNA文库具有组织细胞特异性。cDNA文库显然比基因组DNA文库小得多,能够比较容易从中筛选克隆得细胞特异表达的基因。但对真核细胞来说,从基因组DNA文库获得的基因与从cDNA文库获得的不同,基因组DNA文库所含的是带有含子和外显子的基因组基因,而从cDNA文库中获得的是已经过剪接、去除了内含子的cDNA。
图20-9 cDNA文库的构建
三、聚合酶链式反应(PCR)
如果已经知道目的基因的序列,就能很方便地用PCR聚合酶链式反应,polymerase chain reaction,从基因组DNA或cDNA中获得目的基因,可不必要经过复杂的DNA文库构建过程。PCR是70年代中期创立的技术,其基本原理如图20-10所示。
图20-10 PCR基本原理示意图
PCR反应系统包括含有目的基因或序列的DNA模板,对热稳定的DNA聚合酶,一对脱氧寡核苷酸引物、DNA合成所需要的4种脱氧核苷三磷酸以及保证聚合酶催化反应的Mg2+及缓冲液等。人工合成引物的序列设计是PCR成功的关键,一般两条引物的序列反应分别与欲获得的双链DNA两条链3’端的序列互补。先升高温度使模板DNA变性、双链分开;再降低温度退火使引物与模板DNA配对互补结合;然后升温到聚合酶反应适宜的温度,此时在聚合酶催化下,从引物3’羟基端开始,与模板DNA上的碱基配对逐个加上核苷酸,合成新的DNA链。其后再按高温变性、低温退火、适温合成三步反复循环,新合成的DNA在下一循环中又作为模板使用,每循环一次,合成的目的序列扩增一倍,而且很快扩增的序列主要限制在所设计的一对引物规定的模板序列范围内,一般循环30-40次,按理论计算,目的序列可扩增230-240倍,而实际上由于底物和引物的消耗,酶的失活等因素,产物量并不是始终以指数增加的,但通常实验获得目的序列106-108倍的扩增产物并不困难,因而PCR具有很高度的灵敏度,由于引物与模板的配对互补结合的特异的,因而PCR也具有高度的特异性。所以可以方便地用PCR在成千上万的基因序列中获得只有极微含量的特定目的基因或序列,PCR获得的目的序列产物连接在适当的载体上,转化受体细胞,经筛选就能得到目的序列的克隆。
现在PCR技术还在不断发展,已知部分序列或未知序列的基因有的也能设计PCR来扩增和克隆,模板核酸可用双链DNA,单链DNA,甚至RNA。由于PCR的高灵敏度和特异性,在基因诊断上有更广泛的应用,后面的章节还要叙述。
四、人工化学合成
随化学合成技术的发展,现在计算机控制的全自动核酸合成仪已被广泛应用,按人们设计好的序列一次合成100-200bp长的DNA片段已不成问题。可能用这些合成的片段组合连接成完整的基因。但目前人工合成基因最大的限制是人们并未掌握怎样的核酸序列能具有生命功能的规律,例如1kb长的DNA最通常编码功能蛋白质的基因长度就可以有~10600种不同的序列,随意合成的DNA绝大多数肯定是不具有生物功能或无法知道它会有什么功能的,因而只能模仿自然界生物中已知的基因序列来合成,而化学合成这样长的基因DNA序列,其价格远高于用PCR法获得基因,所以目前很少全部用化学方法去合成基因。但人工设计化学合成核酸片段作为引物、接头等已经是分子生物学和基因工程中必不可少的、十分重要的手段。
从生物组织细胞提取出全部DNA,用物理方法(超声波、搅拌剪力等)或酶法(限制性核酸内切酶的不完全酶解)将DNA降解成预期大小的片段,然后将这些片段与适当的载体(常用噬菌体、粘粒或YAC载体)连接,转入受体细菌或细胞,这样每一个细胞接受了含有一个基因组DNA片段与载体连接的重组DNA分子,而且可以繁殖扩增,许多细胞一起组成一个含有基因组各DNA片段克隆的集合体,就称为基因组DNA文库(genomic DNA library)。如果这个文库足够大,能包含该生物基因组DNA全部的序列,就是该生物完整的基因组文库,能从这文库中钓取该生物的全部基因或DNA序列。从基因组含有生物生存、活动和繁殖的全部遗传信息的概念出发,基因组文库是具有生物种属特异性的。
构建基因组文库,再用分子杂交等技术去钓取基因克隆的方法,称为鸟枪法或散弹射击法,意味着从含有众多的基因序列克隆群中去获取目的基因或序列。当生物基因组比较小时,此法较易成功;当生物基因组很大时,构建其完整的基因组文库就非易事,从庞大的文库中去克隆目的基因工程量也很大。
图20-8 基因组DNA文库的构建
二、cDNA文库
以mRNA为模板,经反转录酶催化合成DNA,则此DNA序列与mRNA互补,称为互补DNA或cDNA。提取出组织细胞的全部mRNA,在体外反转录成cDNA,与适当的载体常用噬菌体或质粒载体连接后转化受体菌,则每个细菌含有一段cDNA,并能繁殖扩增,这样包含着细胞全部mRNA信息的cDNA克隆集合称为该组织细胞的cDNA文库,基因组含有的基因在特定的组织细胞中只有一部分表达,而且处在不同环境条件、不同分化时期的细胞其基因表达的种类和强度也不尽相同,所以cDNA文库具有组织细胞特异性。cDNA文库显然比基因组DNA文库小得多,能够比较容易从中筛选克隆得细胞特异表达的基因。但对真核细胞来说,从基因组DNA文库获得的基因与从cDNA文库获得的不同,基因组DNA文库所含的是带有含子和外显子的基因组基因,而从cDNA文库中获得的是已经过剪接、去除了内含子的cDNA。
图20-9 cDNA文库的构建
三、聚合酶链式反应(PCR)
如果已经知道目的基因的序列,就能很方便地用PCR聚合酶链式反应,polymerase chain reaction,从基因组DNA或cDNA中获得目的基因,可不必要经过复杂的DNA文库构建过程。PCR是70年代中期创立的技术,其基本原理如图20-10所示。
图20-10 PCR基本原理示意图
PCR反应系统包括含有目的基因或序列的DNA模板,对热稳定的DNA聚合酶,一对脱氧寡核苷酸引物、DNA合成所需要的4种脱氧核苷三磷酸以及保证聚合酶催化反应的Mg2+及缓冲液等。人工合成引物的序列设计是PCR成功的关键,一般两条引物的序列反应分别与欲获得的双链DNA两条链3’端的序列互补。先升高温度使模板DNA变性、双链分开;再降低温度退火使引物与模板DNA配对互补结合;然后升温到聚合酶反应适宜的温度,此时在聚合酶催化下,从引物3’羟基端开始,与模板DNA上的碱基配对逐个加上核苷酸,合成新的DNA链。其后再按高温变性、低温退火、适温合成三步反复循环,新合成的DNA在下一循环中又作为模板使用,每循环一次,合成的目的序列扩增一倍,而且很快扩增的序列主要限制在所设计的一对引物规定的模板序列范围内,一般循环30-40次,按理论计算,目的序列可扩增230-240倍,而实际上由于底物和引物的消耗,酶的失活等因素,产物量并不是始终以指数增加的,但通常实验获得目的序列106-108倍的扩增产物并不困难,因而PCR具有很高度的灵敏度,由于引物与模板的配对互补结合的特异的,因而PCR也具有高度的特异性。所以可以方便地用PCR在成千上万的基因序列中获得只有极微含量的特定目的基因或序列,PCR获得的目的序列产物连接在适当的载体上,转化受体细胞,经筛选就能得到目的序列的克隆。
现在PCR技术还在不断发展,已知部分序列或未知序列的基因有的也能设计PCR来扩增和克隆,模板核酸可用双链DNA,单链DNA,甚至RNA。由于PCR的高灵敏度和特异性,在基因诊断上有更广泛的应用,后面的章节还要叙述。
四、人工化学合成
随化学合成技术的发展,现在计算机控制的全自动核酸合成仪已被广泛应用,按人们设计好的序列一次合成100-200bp长的DNA片段已不成问题。可能用这些合成的片段组合连接成完整的基因。但目前人工合成基因最大的限制是人们并未掌握怎样的核酸序列能具有生命功能的规律,例如1kb长的DNA最通常编码功能蛋白质的基因长度就可以有~10600种不同的序列,随意合成的DNA绝大多数肯定是不具有生物功能或无法知道它会有什么功能的,因而只能模仿自然界生物中已知的基因序列来合成,而化学合成这样长的基因DNA序列,其价格远高于用PCR法获得基因,所以目前很少全部用化学方法去合成基因。但人工设计化学合成核酸片段作为引物、接头等已经是分子生物学和基因工程中必不可少的、十分重要的手段。