引物设计有3条基本原则:首先引物与模板的序列要紧密互补,其次引物与引物之间避免形成稳定的二聚体或发夹结构,再次引物不能在模板的非目的位点引发DNA聚合反应(即错配)。
具体实现这3条基本原则需要考虑到诸多因素,如引物长度(primer length),产物长度(product length),序列Tm值(melting temperature),引物与模板形成双链的内部稳定性(internal stability, 用G值反映),形成引物二聚体(primer dimer)及发夹结构(duplex formation and hairpin)的能值,在错配位点(false priming site)的引发效率,引物及产物的GC含量(composition),等等。必要时还需对引物进行修饰,如增加限制性内切酶位点,引进突变等。
引物设计应注意如下要点:
1. 引物的长度一般为15-30bp,常用的是18-27bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于TaqDNA聚合酶进行反应。
2. 引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错配。引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增加。
3. 引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应当避免在引物的3’端使用碱基A。另外,引物二聚体或发夹结构也可能导致PCR反应失败。5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物。
4. 引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。
5. 引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。Tm值的计算有多种方法,如按公式
Tm=4(G+C)+2(A+T),在Oligo软件中使用的是最邻近法(the nearest neighbor method)。
6. G值是指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。应当选用3’端△G值较低(绝对值不超过9),而5’端和中间△G值相对较高的引物。引物的3’端的△G值过高,容易在错配位点形成双链结构并引发DNA聚合反应。
7. 引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且降低了引物有效浓度而使PCR反应不能正常进行。
8. 对引物的修饰一般是在5’端增加酶切位点,应根据下一步实验中要插入PCR产物的载体的相应序列而确定。值得一提的是,各种模板的引物设计难度不一。有的模板本身条件比较困难,例如GC含量偏高或偏低,导致找不到各种指标都十分合适的引物;在用作克隆目的的PCR因为产物序列相对固定,引物设计的选择自由度较低。在这种情况只能退而求其次,尽量去满足条件。

