为实现大豆高通量基因分型和分子标记辅助选择(MAS),根据大豆中已报道的重要性状基因功能位点,开发了22个KASP标记,分别对应大豆结荚习性(Dt1基因)、多粒荚(Ln基因)、炸荚(Pdh1基因)、籽粒大小(GmSSS1、GmST05基因)、开花期(J,GmPRR3a,GmPRR3b,GmFUL2a,GmLHY1a,GmLHY1b,GmSOC1a,E4基因)、蛋白和油分含量(GmSWEET39基因)、胡萝卜素含量(GmCCD4基因)、磷利用效率(GmPHF1基因)、氮利用效率(GmGLP20.4基因)、根瘤共生兼容性(Rj2基因)和细胞分裂素合成(GmCXK7-1基因)等性状和基因。对标记的分型鉴定表明,除e4-sore大片段标记不能区分杂合样本外,其余21个标记均能对杂合和两种纯合基因型进行准确分型。结合表型信息对多粒荚、叶形和结荚习性标记的表型选择效率进行了评估,结果表明多粒荚Ln基因分子标记对表型的选择效率为84.0%,对叶形的选择效率为94.8%,结荚习性Dt1基因分子标记对表型的选择效率为87.4%,显示出较高的预测准确性。本实验开发的22个功能标记可对基因型进行准确分型,在大豆分子标记辅助选择中具有重要利用价值
分子标记辅助选择(marker-assisted selection, MAS)是指利用与目标基因紧密连锁的分子标记对供试材料进行选择,可在不进行复杂表型收集的条件下选育出含有目标性状基因型的品种。功能标记(functional marker,FM)是一种根据与表型存在因果关系的多态性位点开发的分子标记[1]。功能标记分为两种,其中,直接功能标记是通过多态性位点分析基因产物的变化,如蛋白质结构和基因转录丰度变化等,最终直接影响生物表现型的一类功能位点;间接功能标记是通过评估表型与基因序列多态性的连锁程度选择连锁程度高的位点[1]。功能标记的开发过程需要在已知基因序列信息的基础上结合大量样本的基因型和表型数据进行分析,所以相较于其他类型分子标记,功能标记的挖掘过程复杂,且位点数量稀少。若某个位点被证明为功能位点,便可依此开发功能标记,对品种进行基因型鉴定,甚至可在一定程度上对表型(质量性状)进行预测。
作物育种中常用的功能标记主要为普通琼脂糖凝胶检测标记[2]、酶切扩增多态性序列(cleaved amplified polymorphic sequence,CAPS)标记[3]、衍生型酶切扩增多态性序列(derived cleaved amplified polymorphic sequence,dCAPS)标记[4]以及竞争性等位基因特异PCR(kompetitive allele specific PCR,KASP)标记[5]等。其中,琼脂糖凝胶检测标记、CAPS和dCAPS标记都需要借助琼脂糖凝胶电泳技术,根据扩增产物的长度进行分型,流程复杂,耗时较长,难以实现高通量的应用。KASP标记则是基于末端荧光读取的基因分型技术,通过引物末端携带的特异位点匹配SNP进行双等位基因精准分型,只需要常规的qPCR仪器就能读取,兼容性良好,不需要经过电泳,也不需要购买额外的测序仪器就能实现准确分型。因其具有高通量、低错误率、低成本等优点,KASP标记已成为新一代SNP分型的热门技术[6]。在大豆中,KASP已经应用于基因发掘、分子标记辅助选择、资源鉴定等方面。叶俊华等利用已开发的胞囊线虫抗性和耐盐KASP标记对来自不同国家的1 489份大豆种质资源进行了鉴定,共筛选到1 084份携带优良等位基因的大豆种质资源[7]。Patil等人针对大豆油酸、亚油酸、水苏糖、棉子糖、脂肪氧化酶、胰蛋白酶抑制剂等种子活性与营养成分相关性状功能等位基因突变开发了KASP标记,可用于加快大豆种子性状改良[8]。Liu等利用大豆生育期基因E1-E4基因功能性SNP位点开发了KASP标记,对我国不同生育期组大豆品种进行了基因型鉴定,阐明了不同生育期组大豆品种E1-E4基因的构成[5]。Fatima等针对大豆组蛋白基因GmHH3-3的功能位点开发了KASP标记,并利用该标记对46份大豆种质进行了基因型鉴定,最终筛选出携带GmHH3-3T 等位变异、具有更高千粒重的品种[9]。Shaibu等利用BSA技术成功鉴定出大豆胞囊线虫抗性基因GmSNAP11,并开发了KASP功能标记,可用于筛选具有胞囊线虫4号小种抗性的品种[10]。这些已开发的KASP标记不仅可以用于育成品种的基因型鉴定,也可应用于后代群体的快速筛选。
近年来,随着分子生物学和基因组学的快速发展,在大豆中已克隆了一批功能基因,并开发了部分基因的KASP标记[5,7-10],但仍有一些基因的功能标记尚未开发,包括结荚习性相关基因Dt1 [11],多粒荚相关基因Ln [12],炸荚性相关基因Pdh1 [13],籽粒大小相关基因GmSSS1 [14]和GmST05 [15],开花期相关基因J [16]、GmPRR3a [17]、GmPRR3b [18]、GmFUL2a [19]、GmLHY1a [20]、GmLHY1b [21]、GmSOC1a [22]、E4 [23],蛋白质和油分相关基因SWEET39 [24],胡萝卜素含量相关基因GmCCD4 [25],磷利用效率相关基因GmPHF1 [26],氮利用效率相关基因GmGLP20.4 [27],根瘤共生兼容性相关基因Rj2 [28]和细胞分裂素合成相关基因GmCKX7-1 [29]等。本研究在收集大豆中已经报道的重要性状功能位点的基础上,开发相应的KASP标记,以期构建大豆基因型快速鉴定平台,提高大豆分子标记辅助选择效率。
1 材料与方法
1.1 材料
1.1.1 田间试验材料及表型采集
选择175份我国东北、黄淮海和南方历年大面积种植品种(附表1,见首页OSID码),于2021年种植于中国农业科学院顺义试验基地(40°13′ N,116°33′ E)采集表型,田间试验采用随机区组设计,设置3次重复。每个品种2米行长,行距0.5米,株距0.1米,按照常规措施进行田间管理。每行选取5株长势较为一致的单株进行表型收集,生长期间记录叶型和开花期[30],收获后对炸荚性、多粒荚和结荚习性进行收集。开花时间为出苗(VE)到开花(R1)的天数[30]。
表1 基因功能位点及对应表型信息Table 1 Functional loci of genes and the related phenotypic information |
类别 Category | 性状 Trait | 基因 Gene | 标记 Marker | 多态性 Polymorphism | FAM等位基因 FAM-allele | HEX等位基因 HEX-allele | 来源 Source | ||||
---|---|---|---|---|---|---|---|---|---|---|---|
位点 Locus | 等位基因 Allele | 表型 Phenotype | 位点 Locus | 等位基因 Allele | 表型 Phenotype | ||||||
形态 Morphology | 结荚习性 Stem growth habit | DT1 | dt1-ta | G/T | G | Dt1 | 无限或亚有限 Indeterminate or Semi-determinate | T | dt1-ta | 有限 Determinate | [11] |
DT1 | dt1-ab | C/T | C | Dt1 | 无限或亚有限 Indeterminate or Semi-determinate | T | dt1-ab | 有限 Determinate | [11] | ||
DT1 | dt1-tb | G/A | G | Dt1 | 无限或亚有限 Indeterminate or Semi-determinate | A | dt1-tb | 有限 Determinate | [11] | ||
DT1 | dt1-bb | A/T | A | Dt1 | 无限或亚有限 Indeterminate or Semi-determinate | T | dt1-bb | 有限 Determinate | [11] | ||
多粒荚 Multi-seed pod | Ln | ln | G/C | G | Ln | 非四粒荚 Non-4-seeded pod | C | ln | 四粒荚 4 seeded pod | [12] | |
炸荚性 Pod shattering | Pdh1 | pdh1 | A/T | T | pdh1 | 抗炸荚 Shattering resistant | A | Pdh1 | 易炸荚 Shattering susceptibility | [13] | |
籽粒大小 Seed size | GmSSS1 | sss1 | G/C | G | SSS1 | 小粒 Small seed | C | sss1 | 大粒 Big seed | [14] | |
GmST05 | st05 | 21bp Indel | Ins | ST05HapII | 小粒 Small seed | Del | ST05HapI | 大粒 Big seed | [15] | ||
开花期及成熟期 Flowering & maturity time | J | j | A/- | A | J | 非长童期 Non-long juvenility | - | j | 长童期 Long juvenility | [16] | |
GmPRR3a | prrr3a | T/- | A | PRR3a | 晚花 Late flowering | - | prr3a | 早花 Early flowering | [17] | ||
GmPRR3b | prr3b | T/C | T | prr3b | 早花 Early flowering | C | PRR3b | 晚花 Late flowering | [18] | ||
GmFUL2a | ful2a | T/A | T | FUL2a | 早花 Early flowering | A | ful2a | 晚花 Late flowering | [19] | ||
GmLHY1a | lhy1a | A/T | A | LHY1a | 晚花 Late flowering | T | lhy1a | 早花 Early flowering | [20] | ||
GmLHY1b | lhy1b | C/G | C | E11 | 早花 Early flowering | G | e11 | 晚花 Late flowering | [21] | ||
GmSOC1a | soc1a | G/A | G | SOC1aG | 早花 Early flowering | A | SOC1aA | 晚花 Late flowering | [22] | ||
E4 | e4-sore | 6.3kb ins | Ins | e4-sore | 早花 Early flowering | Del | E4 | 晚花 Late flowering | [23] | ||
品质 Quality | 蛋白质油脂 Protein and oil content | GmSWEET39 | sweet39 | CC Indel | CC | SWEET39CC | 低油高蛋白 Low oil and high protein | Del | SWEET39Del | 高油低蛋白 High oil and low protein | [24] |
胡萝卜素含量 Carotene content | GmCCD4 | ccd4 | T/A | T | CCD4 | 胡萝卜素含量少 Low carotene content | A | ccd4 | 胡萝卜素含量高 High carotene content | [25] | |
养分高效利用 Nutrient utilization efficiency | 磷利用效率 Phosphorus use efficiency | GmPHF1 | phf1 | C/A | C | PHF1HapII | 磷利用效率高耐低磷胁迫 High P utilization efficiency and tolerance to low phosphorus stress | A | PHF1HapI | 磷利用效率低 Low phosphorus utilization efficiency | [26] |
氮利用效率 Nitrogen use efficiency | GmGLP20.4 | glp20.4 | T/A | T | GLP20.4T | 氮利用效率低 Low nitrogen utilization efficiency | A | GLP20.4A | 氮利用效率高耐低氮胁迫 High nitrogen use efficiency and tolerance to low nitrogen stress | [27] | |
根瘤共生兼容性 Symbiotic compatibility in nodulation | Rj2 | rj2 | G/T | G | rj2 | 共生 Symbiosis | T | Rj2 | 共生不相容 Symbiotic incompatibility | [28] | |
激素 Hormone | 细胞分裂素生物合成 Cytokinin biosynthesis | GmCKX7-1 | ckx7-1 | C/A | C | CKX7-1105H | 较低的细胞分裂素含量 Low cytokinin content | G | CKX7-1105Q | 更高的细胞分裂素含量和理想的产量特性 Higher cytokinin content and ideal yield characteristics | [29] |
1.1.2 基因分型验证材料
根据本实验室已有的重测序数据[31],挑选出27份已知基因型品种,作为标记分型对照及测序验证品种(附表2,见首页OSID码)。
表2 不同基因KASP标记引物序列Table 2 Primer sequences of KASP markers |
基因 Gene | 引物名称 Primer | KASP引物序列 KASP primer sequences | 携带位点 Loci |
---|---|---|---|
Dt1 | dt1-ta_FAM | AGATTGAGGGTGGTGATATGAGG | G |
dt1-ta_VIC | GAGATTGAGGGTGGTGATATGAGT | T | |
dt1-ta_Reverse | ACTGGCAACAGCTTAAGTTTTTTCTCTT | ||
dt1-ab_FAM | TGAGCTATGAGGTCCCAAAGCC | C | |
dt1-ab_VIC | GTGAGCTATGAGGTCCCAAAGCT | T | |
dt1-ab_Reverse | AACAGGACAAACACAAACCTATGGATT | ||
dt1-tb_FAM | GTGGGTGGAGTAACACACTGTC | G | |
dt1-tb_VIC | AGTGGGTGGAGTAACACACTGTT | A | |
dt1-tb_Reverse | GATCATGAGAGAGATCACTGACAAAAA | ||
dt1-bb_FAM | TGCTGTCTACTTCAATGCACAGA | A | |
dt1-bb_VIC | TGCTGTCTACTTCAATGCACAGT | T | |
dt1-bb_Reverse | GTGGCAAAACCAGCAGCTACTTAG | ||
Ln | ln_FAM | ACTCATCGGGCAAATTGTTAAGATC | G |
ln_VIC | ACTCATCGGGCAAATTGTTAAGATG | C | |
ln_Reverse | GTTCCTTTACAGGAGACCAGAACGAA | ||
Rj2 | rj2_FAM | CTCAATCAAGTCATGCATTGTAACTC | G |
rj2_VIC | CCTCAATCAAGTCATGCATTGTAACTA | T | |
rj2_Reverse | ACAAAGGTTGAAGATATACTTCGTGCTC | ||
Pdh1 | pdh1_FAM | AGGCCACAACATGCACCATGCT | T |
pdh1_VIC | AGGCCACAACATGCACCATGCA | A | |
pdh1_Reverse | CTGCGTTGCTTCCGTTGTAGATGAT | ||
J | J_FAM | CATTCTCTGCAGAACATTCCATTTT | A |
J_VIC | CATTCTCTGCAGAACATTCCATTTA | - | |
J_Reverse | GGCAACAAAACCTTAAGCGCAA | ||
GmPRR3a | prr3a_FAM | TTGACAATCAGAATGATAAATATGGAAAA | A |
prr3a_VIC | CTTGACAATCAGAATGATAAATATGGAAAT | T | |
prr3a_Reverse | GCCCCATTCCCAAAGCTTTT | ||
GmPRR3b | prr3b_FAM | CCCATAAAGCTGCAGTAGATCCCT | T |
prr3b_VIC | CCATAAAGCTGCAGTAGATCCCC | C | |
prr3b_Reverse | GATACACATTGCGGAGTTGAGCT | ||
GmFUL2a | ful2a_FAM | GGGAAGAATGGTTTTAGGTCGACA | T |
ful2a_VIC | GGGAAGAATGGTTTTAGGTCGACT | A | |
ful2a_Reverse | CAGTTGATCTCTGGTTTTTGAATTTGC | ||
GmLHY1a | lhy1a_FAM | GCTGCAATAGCTGCAACGCT | A |
lhy1a_VIC | GCTGCAATAGCTGCAACGCA | T | |
lhy1a_Reverse | TTCGCTGCTACATTTTGGCCG | ||
GmLHY1b | lhy1b_FAM | TGCTAACACTTCTACGACGATTACTAAAG | C |
lhy1b_VIC | TGCTAACACTTCTACGACGATTACTAAAC | G | |
lhy1b_Reverse | CCTAGATTCCAACAAAACAAAGGGCAG | ||
GmSOC1a | soc1a_FAM | GCAGAGAGAAACTCAGAAAAAGGGA | T |
soc1a_VIC | GCAGAGAGAAACTCAGAAAAAGGGG | C | |
soc1a_Reverse | AACAATTGTGTCTTAATATGGTGGGG | ||
E4 | e4-sore_FAM | CACCCTATCATAACCTGTGAGTTCATG | Ins |
e4-sore_VIC | CACCCTATCATAACCTGTGAGTTCAAA | Del | |
e4-sore_Reverse1 | TGCAATCGTTGCCTAGTGGGAG | ||
e4-sore_Reverse2 | CTGGAGGTATGATTTGATCTGTAATTTC | ||
GmSSS1 | sss1_FAM | TGTGAAACAGTGGTACGCATACCTC | G |
sss1_VIC | TGTGAAACAGTGGTACGCATACCTG | C | |
sss1_Reverse | ATGTAGAGGCGCTCATTGGAAAA | ||
GmST05 | st05_FAM | TTTAAAACATATTGAATGAGAAACCATAATT | TAATGATCCACTTAAAATAAT |
st05_VIC | TTTAAAACATATTGAATGAGAAACCATAATA | - | |
st05_Reverse | TTGACAGAGAGATATTATCCCCAGCTCT | ||
GmSWEET39 | sweet39_FAM | ATCCACTTCCTCTGCGATTGG | CC |
sweet39_VIC | ATCCACTTCCTCTGCGATTGA | - | |
sweet39_Reverse | GCAAGCTTTAGCTGAAGGAGCG | ||
GmCCD4 | ccd4_FAM | CACCACCACCACTCAAAAAGCTAT | T |
ccd4_VIC | CACCACCACCACTCAAAAAGCTAA | A | |
ccd4_Reverse | GGATGATGATGGGCTTGGTTTG | ||
GmPHF1 | phf1_FAM | AAATGAAAGTTGATTAATTTTGAGGGTTG | C |
phf1_VIC | AAATGAAAGTTGATTAATTTTGAGGGTTT | A | |
phf1_Reverse | TGGACCCATCTCTCCCTTCTTTCTAT | ||
GmGLP20.4 | glp20.4_FAM | ATTGGTGCTCAACGTTACGGTTA | T |
glp20.4_VIC | ATTGGTGCTCAACGTTACGGTTT | A | |
glp20.4_Reverse | TCCCAATTTAAAATAGCCGTGATTACTAA | ||
GmCKX7-1 | ckx7-1_FAM | CGAGGGAGAGGAGGGTGAAG | C |
ckx7-1_VIC | CGAGGGAGAGGAGGGTGAAC | G | |
ckx7-1_Reverse | AGAACGGCCTCGTCCTAGACA |
1.2 方法
1.2.1 DNA提取
取大豆幼嫩三出复叶约100 mg,使用植物基因组DNA提取试剂盒(北京康为世纪生物科技有限公司产品)提取DNA,用1%琼脂糖凝胶电泳鉴定DNA完整性,用紫外分光光度计测定DNA浓度和A260/A280吸光值(A260/A280尽量在1.7~2.0之间),稀释浓度至5~10 ng·µL-1,置于-20℃冰箱保存。
1.2.2 KASP标记设计及基因分型
根据已发表文章中提供的基因序列号和位点信息(位点信息如表1所示),利用pytotzome(https://phytozome-next.jgi.doe.gov/)下载位点上下游300 bp序列信息,利用DNAMAN(https://www.lynnon.com/dnaman.html)设计不同基因的KASP引物,KASP引物序列如表2所示,每个基因KASP引物包含2条特异性引物和1条通用引物。2条特异性引物分别设计5'端带有FAM(5'GAAGGTGACCAAGTTCATGCT3')和HEX(5'GAAGGTCGGAGTCAACGGATT3')荧光标签序列,3'端携带不同等位基因的SNP位点。通用引物设计在距SNP位点100 bp左右的位置,并且包含与同源基因不同的特异位点。KASP引物在北京生物工程公司合成。
配置100 µL KASP引物体系时,加2种特异性引物各12 µL、通用引物30 µL和ddH2O 46 µL。配置e4-sore标记100 µL引物体系略有不同,需加2种特异性引物各12 µL、2种通用引物各30 µL和ddH2O 16 µL。分型所用试剂为北京嘉程生物科技有限公司HiGeno 2x Probe Mix试剂,实验采用384孔板,每孔为5 µL反应体系(2.43 µL稀释后的DNA,2.5 µL HiGeno 2x Probe Mix,0.07 µL引物体系混合物)。在Quantstudio 7 Flex上的PCR反应程序为:(1)KASP循环:95℃预变性10 min;95℃变性20 s;61℃-55℃退火/延伸40 s, 10个循环(每个循环下降0.6℃);95℃变性20 s;55℃退火/延伸40 s, 30个循环;37℃读取1 min。利用重测序数据挑选出的27份品种(表2),作为KASP分型的纯合对照。每个标记等量混合两种不同等位基因DNA作为分型的杂合对照。利用PCR技术对目标位点进行扩增(附表3,见首页OSID码),进行测序,结合测序和KASP标记分型结果验证标记分型准确性。
1.2.3 基因分型与数据统计分析
利用TaqMan Genotyper Software读取KASP分型结果,绘制分型图。利用Excel对表型和基因型进行数据整理和显著性分析。
2 结果与分析
2.1 大豆形态性状标记的开发与鉴定
2.1.1 大豆结荚习性、叶形、多粒荚性状表型
田间采集到的各品种结荚习性、叶形、多粒荚表型信息详见附表1(见首页OSID码)。其中,单荚粒数为四粒荚的品种63份,非四粒荚品种112份;叶形为披针叶品种57份,卵圆叶品种94份,圆叶品种23份,长椭圆叶品种2份。除披针叶外,卵圆、长椭圆和圆叶都统称为圆叶型叶片。结荚习性为无限结荚习性品种45份,亚有限结荚习性品种58份,有限结荚习性品种72份。
2.1.2 大豆结荚习性相关基因Dt1的KASP标记开发与鉴定
在大豆结荚习性基因Dt1的编码区内,存在4种不同的单碱基非同义替换,使翻译过程中的氨基酸发生变化,最终导致大豆结荚习性由无限或亚有限结荚变为有限结荚[11]。这4种突变后的基因型分别为dt1-ta、dt1-ab、dt1-tb和dt1-bb,其中dt1-ta是由Dt1编码区第186个碱基上由G到T的非同义突变,使结荚习性由无限或亚有限转变为有限;dt1-ab是Dt1编码区第338个碱基上由C到T的非同义突变,使结荚习性由无限或亚有限转变为有限;dt1-tb是Dt1编码区第389个碱基上由G到A的非同义突变,使结荚习性由无限或亚有限转变为有限;dt1-bb是Dt1编码区第496个碱基上由C到T的非同义突变,使结荚习性由无限或亚有限转变为有限。本研究根据这4种非同义突变位点分别设计了4对KASP标记即dt1-ta、dt1-ab、dt1-tb和dt1-bb。dt1-ta的两条特异引物分别在3’末端携带G和T碱基;dt1-ab的两条特异引物分别在3’末端携带C和T碱基;dt1-tb的两条特异引物分别在3’末端携带G和A碱基;dt1-bb的两条特异引物分别在3’末端携带C和T碱基。通用引物均携带与同源基因不同的特异性位点。分型结果如图1所示。其中,分型图1A为dt1-ta标记分型图,蓝色圆点代表携带G碱基的Dt1基因型(无限或亚有限结荚习性)样本,红色圆点代表携带T碱基的dt1-ta基因型(有限结荚习性)样本,绿色圆点代表混合杂合DNA样本;分型图1B为dt1-ab标记分型图,蓝色圆点代表携带C碱基的Dt1基因型(无限或亚有限结荚习性)样本,红色圆点代表携带T碱基的dt1-ab基因型(有限结荚习性)样本,绿色圆点代表混合杂合DNA样本;分型图1C为dt1-tb标记分型图,蓝色圆点代表携带G碱基的Dt1基因型(无限或亚有限结荚习性)样本,红色圆点代表携带A碱基的dt1-tb基因型(有限结荚习性)样本,绿色圆点代表混合杂合DNA样本;分型图1D为dt1-bb标记分型图,蓝色圆点代表携带C碱基的Dt1基因型(无限或亚有限结荚习性)样本,红色圆点代表携带T碱基的dt1-bb基因型(有限结荚习性)样本,绿色圆点代表混合杂合DNA样本。以上图中黑色圆点均代表空白对照。KASP基因分型结果表明,基因型已知的对照品种分型结果与实验预期一致。将对照品种进行测序,测序结果与分型结果一致,证明这4个标记可以在育种中应用。
图1 dt1-ta、dt1-ab、dt1-tb和dt1-bb标记KASP分型图注:A: dt1-ta标记的KASP分型图; B: dt1-ab标记的KASP分型图; C: dt1-tb标记的KASP分型图; D: dt1-bb标记的KASP分型图Fig. 1 Scatter plots of KASP genotyping for dt1-ta, dt1-ab, dt1-tb and dt1-bb markers Note: A: Scatter plots of KASP genotyping for dt1-ta marker; B: Scatter plots of KASP genotyping for dt1-ab marker; C: Scatter plots of KASP genotyping for dt1-tb marker; D: Scatter plots of KASP genotyping for dt1-bb marker |
利用dt1-ta、dt1-ab、dt1-tb和dt1-bb标记对175份大豆品种进行分型,并将得到的分型结果与收集到的结荚习性表型进行对比,分析这4个位点对表型的选择效率。结果显示,在175份品种中,153份的表型与基因型结果一致,这4个位点对大豆结荚习性的选择效率为87.4%(表3)。
表3 dt1-ta、dt1-ab、dt1-tb和dt1-bb标记对表型的选择效率Table 3 Efficiency of dt1-ta, dt1-ab, dt1-tb and dt1-bb markers for selection of growth habit phenotypes |
标记名称 Maker | 品种数量(n) Number of varieties | 与表型对应关系 Consistency | 所占比例 /% Percentage |
---|---|---|---|
dt1-ta, dt1-ab, dt1-tb, dt1-bb | 153 | 一致 Consistent | 87.40 |
22 | 不一致 Inconsistent | 12.50 |
2.1.3 大豆多粒荚性状相关基因Ln的KASP标记开发与鉴定
在Ln基因编码区第25个碱基上检测到一个由G到C的非同义突变,该突变使原本蛋白翻译过程中的天冬氨酸变为组氨酸,最终影响胚珠的形成,导致大豆四粒荚表型的产生,此位点同时也参与叶片形状的调控[12]。针对此SNP反向设计了两条携带不同碱基的KASP特异引物,一条引物3’末端携带G(C)碱基,另一条引物3’末端携带C(G)碱基,位点前的碱基序列均相同,通用引物携带与同源基因不同的特异性位点,这3条引物为ln标记。分型结果如图2A所示。在该分型图中,蓝色圆点代表携带G碱基的Ln(非四粒荚)基因型样本,红色圆点代表携带C位点的ln基因型(四粒荚)样本,绿色圆点代表混合杂合DNA样本。图中黑色圆点代表空白对照。KASP基因分型结果表明,基因型已知的对照品种分型结果与实验预期一致。将对照品种进行测序,分型结果与测序结果一致,证明该标记可在育种中应用。利用该标记对175份大豆品种进行基因分型,将得到的分型结果与田间收集的多粒荚和叶型表型信息进行对比,验证标记对表型的选择效率。经过统计,该标记对多粒荚表型的选择效率为84.0%,对叶形的选择效率为94.8%(表4)。
图2 ln、pdh1、sss1和st05标记KASP分型图注:A: ln标记的KASP分型图; B: pdh1标记的KASP分型图; C: sss1标记的KASP分型图; D: st05标记的KASP分型图Fig. 2 Scatter plots of KASP genotyping for ln, pdh1, sss1 and st05 markers Note: A: Scatter plots of KASP genotyping for ln marker; B: Scatter plots of KASP genotyping for pdh1 marker; C: Scatter plots of KASP genotyping for sss1 marker; D: Scatter plots of KASP genotyping for st05 marker |
表4 ln标记对表型的选择效率Table 4 Efficiency of ln marker for phenotypes selection |
标记名称 Maker | 检测表型 Phenotype | 品种数量(n) Number of varieties | 与表型对应关系 Consistency | 所占比例 /% Percentage |
---|---|---|---|---|
ln | 多粒荚 Multi-seed pods | 147 | 一致 Consistent | 84.00 |
28 | 不一致 Inconsistent | 16.00 | ||
叶形 Leaf shape | 166 | 一致 Consistent | 94.80 | |
9 | 不一致 Inconsistent | 5.10 |
2.1.4 大豆炸荚性状相关基因Pdh1的KASP标记开发与鉴定
在调控大豆炸荚的基因Pdh1的编码区第91个碱基上检测到一个A到T的非同义突变,使蛋白翻译提前终止,最终导致大豆出现抗炸荚表型[13]。针对此SNP正向设计了两条携带不同碱基的KASP特异引物,两条特异性引物分别在3’末端携带A和T碱基,位点前的碱基序列均相同,通用引物携带与同源基因不同的特异性位点。分型结果如图2B所示。在该分型图中,蓝色圆点代表携带T碱基的pdh1基因型(抗炸荚)样本,红色圆点代表携带A碱基的Pdh1基因型(不抗炸荚)样本,绿色圆点为混合的杂合DNA样本。图中黑色圆点代表空白对照。KASP基因分型结果表明,基因型已知的对照品种分型结果与实验预期一致。将对照品种进行测序,分型结果与测序结果一致,证明该标记可在育种中应用。
2.1.5 大豆籽粒大小性状相关基因GmSSS1的KASP标记开发与鉴定
Zhu等人发现,GmSSS1(Glyma.19G196000)为控制大豆籽粒大小的基因,当其编码蛋白的第182个残基的谷氨酸替换为谷氨酰胺时对百粒重有增强作用[14]。针对此SNP反向设计了两条携带不同碱基的KASP特异引物,一条引物3’末端携带C(G)碱基,另一条引物3’末端携带G(C)碱基,位点前的碱基序列相同,通用引物携带与同源基因不同的特异性位点,这3条引物为sss1标记。分型结果如图2C所示。在该分型图中,蓝色圆点代表携带G碱基的位点SSS1(籽粒小)基因型的样本,红色圆点代表携带C碱基的sss1基因型(大粒)的样本,绿色圆点代表混合杂合DNA样本。图中黑色圆点代表空白对照。KASP基因分型结果表明,基因型已知对照品种分型结果与实验预期一致。将对照品种进行测序,分型结果与测序结果一致,证明该标记可在育种中应用。
2.1.6 大豆籽粒大小性状相关基因GmST05的KASP标记开发与鉴定
Duan等人发现,GmST05(Glyma.05G244100)为控制大豆籽粒大小的基因,其两个主要单倍型由于启动子区域的自然变异使转录水平产生差异,最终影响种子大小[15]。本研究针对GmST05启动子区域(-617)21 bp最大的Indel,正向设计了两条携带不同碱基的KASP特异引物,一条引物3’末端携带T碱基(Ins),另一条引物3’末端携带A碱基(Del),位点前的碱基序列相同,通用引物携带与同源基因不同的特异性位点,这3条引物为st05标记。分型结果如图2D所示。在该分型图中,蓝色圆点代表Ins,ST05HapII(小粒)基因型的样本,红色圆点代表Del,ST05HapI (大粒)的样本,绿色圆点代表混合杂合DNA样本。图中黑色圆点代表空白对照。KASP基因分型结果表明,基因型已知的对照品种分型结果与实验预期一致。将对照品种进行测序,分型结果与测序结果一致,证明该标记可在育种中应用。
2.2 大豆开花时间相关基因的KASP标记的开发与鉴定
大豆的开花时间是由多个相互作用的基因构成的复杂遗传网络所调控[32]。在目前已克隆的开花期基因中,J与大豆在短日高温下的开花期有直接关系,当其编码区第1 282个碱基A缺失时,蛋白质翻译提前终止,导致大豆在热带地区延迟开花(长童期)、干物质积累量和籽粒产量提高[22]。本实验针对此位点反向设计了j标记,其中一条特异性引物3’末端携带T(A)碱基,另一条特异性引物3’末端携带缺失位点后的A碱基(Del),通用引物携带与同源基因不同的特异性位点。利用已知j基因型品种华夏3号作为缺失型对照,通过等量混合两种不同基因型等位基因DNA做杂合对照,分型结果如图3A所示。在该分型图中,蓝色圆点代表携带A碱基的J基因型(非长童期)样本,红色圆点代表A碱基缺失的j基因型(长童期)样本,绿色圆点代表混合杂合DNA样本。图中黑色圆点代表空白对照。图中多个红色圆点为华夏3号的多个重复样品KASP基因分型结果表明,基因型已知的对照品种分型结果与实验预期一致。将对照品种进行测序,分型结果与测序结果一致,证明该标记可在育种中应用。
图3 j, prr3a、prr3b、ful2a、lhy1a、lhy1b、soc1a和e4-sore标记KASP分型图注:A: j标记的KASP分型图; B: prr3a标记的KASP分型图; C: prr3b标记的KASP分型图; D: ful2a标记的KASP分型图; E: lhy1a标记的KASP分型图; F: lhy1b标记的KASP分型图; G: soc1a标记的KASP分型图; H: e4-sore标记的KASP分型图Fig. 3 Scatter plots of KASP genotyping for j, prr3a, prr3b, lhy1a, lhy1b, soc1a and e4-sore markers Note: A: Scatter plots of KASP genotyping for j marker; B: Scatter plots of KASP genotyping for prr3a marker; C: Scatter plots of KASP genotyping for prr3b marker; D: Scatter plots of KASP genotyping for ful2a marker; E: Scatter plots of KASP genotyping for lhy1a marker; F: Scatter plots of KASP genotyping for lhy1b marker; G: Scatter plots of KASP genotyping for soc1a marker; H: Scatter plots of KASP genotyping for e4-sore marker |
在调控大豆开花时间的功能基因中,GmPRR3a基因编码区第737个碱基A的缺失造成了移码突变,导致蛋白质翻译提前终止,使大豆开花提前[23];GmPRR3b基因编码区第1 879个碱基由C到T的无义突变,使蛋白质翻译提前终止,最终亦使大豆开花提前[24];GmFUL2a基因编码区第682个碱基由T突变为A,使半胱氨酸变为丝氨酸,最终使蛋白质部分功能丧失,使大豆开花延迟[25];GmLHY1a基因编码区第1 267个碱基由A到T的非同义突变,使蛋白质功能缺失,使大豆在短日条件下开花延迟[26];GmLHY1b基因编码区第1 803的一个C到G的非同义突变,使原有的蛋白结构变得松散,使大豆开花延迟[27];GmSOC1a基因启动子区内一个G到A的突变,最终使大豆开花延迟[28]。针对以上位点分别开发了prr3a、prr3b、ful2a、lhy1a、lhy1b和soc1a标记。prr3a标记的两条特异性引物分别在3’末端携带A和T(Del)碱基;prr3b标记的两条特异性引物分别在3’末端携带T和C碱基;ful2a标记采用反向设计,两条特异性引物分别在3’末端携带T(A)和A(T)碱基;lhy1a标记采用反向设计,两条特异引物分别在3’末端携带A(T)和T(A)碱基;lhy1b标记采用反向设计,分别在3’末端携带C(G)和G(C)碱基;soc1a标记的两条特异性引物分别在3’末端携带A和G碱基。这6个标记的通用引物分别携带与同源基因不同的特异性位点。分型结果如图3所示。其中,分型图3B为prr3a标记分型图,蓝色圆点代表携带A碱基的PRR3a基因型(晚花)样本,红色圆点代表A碱基缺失的prr3a基因型(早花)样本,绿色圆点代表混合杂合DNA样本;分型图3C为prr3b标记分型图,红色圆点代表携带C碱基的PRR3b基因型(晚花)样本,蓝色圆点代表携带T碱基的prr3b基因型(早花)样本,绿色圆点代表混合杂合DNA样品;分型图3D为ful2a标记分型图,蓝色圆点代表携带T碱基的Ful2a基因型(早花)样本,红色圆点代表携带A碱基的ful2a基因型(晚花)样本,绿色圆点代表混合杂合DNA样本;分型图3E为lhy1a标记分型图,蓝色圆点代表携带A碱基的LHY1a基因型(早花)样本,红色圆点代表携带T碱基的lhy1a基因型(晚花)样本,绿色圆点代表混合杂合DNA样本;分型图3F为lhy1b标记分型图,蓝色圆点代表携带C碱基的LHY1b基因型(早花)样本,红色圆点代表携带G碱基的lhy1b基因型(晚花)样本,绿色圆点代表混合杂合DNA样本;分型图3G为soc1a标记分型图,蓝色圆点代表携带A的SOC1aA 基因型(晚花)样本,红色圆点代表携带G碱基的SOC1aG 基因型(早花)样本,绿色圆点代表混合杂合DNA样本。以上图中黑色圆点均代表空白对照。KASP基因分型结果表明,基因型已知的对照品种分型结果与实验预期一致。将对照品种进行测序,分型结果与测序结果一致,证明这4个标记可在育种中应用。
E4基因的第一个外显子区域存在6 238 bp的大片段插入,形成反座子结构,影响了蛋白质翻译,最终使大豆早花[29]。本研究针对E4-SORE-1大片段插入,反向设计了e4-sore标记,第一条特异性引物3’末端的两个位点为6 238 bp插入片段内的前两个碱基“TG”,第二条特异性引物3’末端的两个位点为6 238 bp插入片段外的前两个碱基“AA”,第一条通用引物位于插入片段区域内,第二条通用引物位于插入片段区域外。利用基因型已知大片段插入品种呼交07-2479和呼交07-2123[11]作为分型对照品种,通过等量混合两种不同等位基因DNA合成杂合DNA来充当杂合对照,分型结果如图3(H)所示。分型图中,蓝色圆点代表携带插入片段e4-sore基因型品种(图中6个点分别为呼交07-2479和呼交07-2123样品的三个重复),红色圆点代表没有携带插入片段E4基因型品种,黑色圆点代表空白对照。图中并没有出现绿色圆点代表的杂合型DNA,通过与实验设置比较发现,e4-sore标记对纯合缺失/插入的分型结果与实验设置的一致,但却将杂合DNA误判为缺失型基因型,说明本实验开发的e4-sore标记可以对纯合样本进行分型,但不能对杂合样本进行分型。
利用基因型数据和收集到的开花期数据对上述开花期位点的选择效率进行分析。由于j和e4-sore的某一基因型品种数量均不足3个,所以只针对prr3a,prr3b,ful2a,lhy1a,lhy1b和soc1a标记进行了分析,结果如表5所示。对prr3a、prr3b、lhy1a和soc1a标记的鉴定结果显示,这4个位点在开花时间上表现出显著差异。lhy1b标记的鉴定结果显示,LHY1b/lhy1b基因型间虽然在开花期均值上有一定差异,但未达到显著水平。ful2a标记的鉴定结果与预期相反。
表5 携带GmPRR3a、GmPRR3b、GmFUL2a、GmLHY1a、GmLHY1b和GmSOC1a不同等位基因大豆品种的表型差异显著性分析Table 5 Statistical analysis of phenotypic differences in soybean varietiess with different alleles of GmPRR3a, GmPRR3b, mFUL2a, GmLHY1a, GmLHY1b, GmSOC1a |
基因 Gene | 基因型 Genotype | 样本数 Number of varieties | 均值 Average value | 方差 Variance | P-value |
---|---|---|---|---|---|
GmPRR3a | prr3a | 144 | 31.79 | 91.89 | <0.01 |
PRR3a | 31 | 43.84 | 265.81 | ||
GmPRR3b | prr3b | 172 | 33.93 | 100.19 | <0.01 |
PRR3b | 3 | 71.44 | 46.37 | ||
GmFUL2a | ful2a | 15 | 28.78 | 58.81 | 0.08 |
FUL2a | 160 | 34.41 | 148.16 | ||
GmLHY1a | lhy1a | 34 | 44.13 | 110.44 | <0.01 |
LHY1a | 141 | 31.47 | 119.86 | ||
GmLHY1b | Lhy1b | 15 | 37.87 | 186.72 | 0.18 |
LHY1b | 160 | 33.56 | 138.03 | ||
GmSOC1a | SOC1aA | 62 | 37.11 | 97.95 | <0.01 |
SOC1aG | 106 | 32.18 | 94.43 |
2.3 大豆品质性状标记的开发与鉴定
2.3.1 大豆蛋白和油脂含量相关基因GmSWEET39的KASP标记开发与鉴定
Zhang等人发现,当大豆糖转运基因GmSWEET39(Glyma.15G049200)编码区第730位两个碱基CC缺失时会引起移码突变,使GmSWEET39产生过早的终止密码子,导致6个氨基酸的变化,同时使大豆籽粒中蛋白质和油分含量发生改变[16]。本研究针对SWEET39的CC缺失反向设计了两条携带不同碱基的KASP特异引物,一条引物3’末端携带G碱基(CC),另一条引物3’末端携带缺失位点后的A碱基(Del),位点前的碱基序列相同,通用引物携带与同源基因不同的特异性位点,这3条引物为sweet39标记。分型结果如图4A所示。在该分型图中,蓝色圆点代表SWEET39CC (低油高蛋白)基因型的样本,红色圆点代表SWEET39Del (高油低蛋白)的样本,绿色圆点代表混合杂合DNA样本。图中黑色圆点代表空白对照。KASP基因分型结果表明,基因型已知的对照品种分型结果与实验预期一致。将对照品种进行测序,分型结果与测序结果一致,证明该标记可在育种中应用。
图4 sweet39、ccd4、phf1、glp20.4、rj2和 ckx7-1标记KASP分型图注:A: sweet39标记的KASP分型图; B: ccd4标记的KASP分型图; C: phf1标记的KASP分型图; D: glp20.4标记的KASP分型图; E: rj2标记的KASP分型图; F: ckx7-1标记的KASP分型图Fig. 4 Scatter plots of KASP genotyping for sweet39, ccd4, phf1, glp20.4, rj2 and ckx7-1 markers Note: A: Scatter plots of KASP genotyping for sweet39 marker; B: Scatter plots of KASP genotyping for ccd4 marker; C: Scatter plots of KASP genotyping for phf1 marker; D: Scatter plots of KASP genotyping for glp20.4 marker; E: Scatter plots of KASP genotyping for rj2 marker; F: Scatter plots of KASP genotyping for ckx7-1 marker |
2.3.2 大豆胡萝卜素合成相关基因GmCCD4的KASP标记开发与鉴定
GmCCD4是大豆胡萝卜素代谢的关键基因,在其编码区第149个碱基上,检测到一个T到A的非同义突变,使所编码蛋白质的疏水性发生了改变,最终导致大豆中的胡萝卜素含量上升[17]。本实验针对此位点开发了ccd4标记,两条特异性引物分别携带T和A碱基,通用引物携带与同源基因不同的特异性位点。分型结果见图4B。在该图中,蓝色圆点代表携带T碱基的CCD4基因型样本,红色圆点代表携带A碱基的ccd4基因型(胡萝卜素含量升高)样本,绿色圆点代表混合杂合DNA样本。图中黑色圆点代表空白对照。KASP基因分型结果表明,基因型已知的对照品种分型结果与实验预期一致。将对照品种进行测序,分型结果与测序结果一致,证明该标记可在育种中应用。
2.4 大豆养分高效利用性状标记的开发与鉴定
2.4.1 大豆磷利用效率相关基因GmPHF1的KASP标记开发与鉴定
Guo等人发现,大豆磷酸盐转运基因GmPHF1(Glyma.20G190300)上游开放阅读框(uORF)-413 bp的位置上存在一个C到A的突变,以组织特异性方式改变了GmPHF1的表达丰度,最终提高了大豆磷吸收效率[18]。本研究针对PHF1基因-413 bp位置上的SNP,反向设计了两条携带不同碱基的KASP特异引物,一条引物的3’末端携带G碱基(C),另一条引物的3’末端携带T碱基(A),位点前的碱基序列相同,通用引物携带与同源基因不同的特异性位点,这3条引物为phf1标记。分型结果如图4C所示。在该分型图中,蓝色圆点代表携带C碱基的PHF1HapII (磷利用效率高耐低磷胁迫)基因型样本,红色圆点代表携带A碱基的PHF1HapI (磷利用效率低)样本,绿色圆点代表混合杂合DNA样本。图中黑色圆点代表空白对照。KASP基因分型结果表明,基因型已知的对照品种分型结果与实验预期一致。将对照品种进行测序,分型结果与测序结果一致,证明该标记可在育种中应用。
2.4.2 大豆低氮胁迫性状相关基因GmGLP20.4的KASP标记开发与鉴定
Wang等人发现,大豆胚芽素类蛋白基因GmGLP20.4(Glyma.20G190300)启动子区域的一个SNP导致了GT1-motif顺式作用元件的缺失,从而影响了GmGLP20.4在低氮条件下的表达以及氮素利用效率[19]。本研究针对GmGLP20.4启动子区的SNP反向设计了两条携带不同碱基的KASP特异引物,一条引物3’末端携带A碱基(T),另一条引物3’末端携带T碱基(A),位点前的碱基序列相同,通用引物携带与同源基因不同的特异性位点,这3条引物为glp20.4标记。分型结果如图4D所示。在该分型图中,蓝色圆点代表携带T碱基的GLP20.4T (氮利用效率低)基因型样本,红色圆点代表携带A碱基的GLP20.4A(氮利用效率高耐低氮胁迫)基因型样本,绿色圆点代表混合杂合DNA样本。图中黑色圆点代表空白对照。KASP基因分型结果表明,基因型已知的对照品种分型结果与实验预期一致。将对照品种进行测序,分型结果与测序结果一致,证明该标记可在育种中应用。
2.4.3 大豆根瘤共生兼容性相关基因Rj2的KASP标记开发与鉴定
Rj2等位基因可以通过宿主免疫限制与本地根瘤菌感染,以促进与具有更高共生固氮能力的根瘤菌物共生结瘤。Sugawara等人发现,Rj2(Glyma.16G33780)为大豆结瘤诱导基因,当其蛋白序列第490个残基由精氨酸替换异亮氨酸时,会诱发与Bradyrhizobium diazoefficiens USDA 122的共生不相容[21]。本研究针对Rj2的SNP,反向设计了两条携带不同碱基的KASP特异引物,一条引物3’末端携带C碱基(G),另一条引物3’末端携带A碱基(T),位点前的碱基序列相同,通用引物携带与同源基因不同的特异性位点,这3条引物为rj2标记。分型结果如图4E所示。在该分型图中,蓝色圆点代表携带G碱基的rj2基因型样本,红色圆点代表携带T碱基的Rj2(共生不相容)基因型样本,绿色圆点代表混合杂合DNA样本。图中黑色圆点代表空白对照。KASP基因分型结果表明,基因型已知的对照品种分型结果与实验预期一致。将对照品种进行测序,分型结果与测序结果一致,证明该标记可在育种中应用。
2.5 大豆细胞分裂素合成相关基因GmCKX7-1的KASP标记开发与鉴定
Hai等人发现,GmCKX7-1(Glyma.14G099000)为大豆细胞分裂素氧化脱氢酶基因,当其蛋白序列第105个残基由组氨酸替换成谷氨酰胺时,将影响蛋白结构的完整性,减弱GmCKX7-1的活性,从而在生殖阶段增强细胞分裂素的积累,延迟衰老,增强光合作用和原基的形成,同时增加穗数、花数和大小、荚数、种子数和单粒重[20]。本研究针对CKX7-1的位置上的SNP,反向设计了两条携带不同碱基的KASP特异引物,一条引物3’末端携带G碱基(C),另一条引物3’末端携带C碱基(G),位点前的碱基序列相同,通用引物携带与同源基因不同的特异性位点,这3条引物为ckx7-1标记。分型结果如图4F所示。在该分型图中,蓝色圆点代表携带C碱基的CKX7-1105H (较低的细胞分裂素含量)基因型样本,红色圆点代表携带G碱基的CKX7-1105Q (更高的细胞分裂素含量和理想的产量特性)基因型样本,绿色圆点代表混合杂合DNA样本。图中黑色圆点代表空白对照。KASP基因分型结果表明,基因型已知的对照品种分型结果与实验预期一致。将对照品种进行测序,分型结果与测序结果一致,证明该标记可在育种中应用。
3 讨论与结论
在作物育种中,功能标记的应用不仅可以实现高通量基因分型,而且可进行精准的分子标记辅助选择,缩短育种周期,提高育种效率。KASP作为一种双荧光末端SNP基因分型技术,具有高通量、低错误率、低成本、共显性等特点,已成为新一代主流分子标记。目前,在大豆育种中,KASP技术主要应用于连锁图谱绘制、QTL定位、基因挖掘、资源鉴定等方面[5,7,33,34]。卢一鹏等利用KASP技术对前期定位的大豆蔓生主效位点qVG-19开发了KASP标记,对基因型的鉴定准确率高达99%,可加速该QTL的精细定位[33]。练云等利用抗胞囊线虫主效位点Rhg1和Rhg4的6个KASP标记对487份大豆种质资源进行筛选,共筛选到22份大豆具有抗性位点的材料,其中20份携带两个抗性等位基因,2份只携带Rhg4抗性位点[34]。Liu等利用开发的KASP标记,对405份不同生育期大豆材料E1-E4基因型进行了鉴定[5]。Chahat等开发了GmHH3-3 KASP标记,并鉴定出46份携带GmHH3-3等位变异的基因型[9]。Shaibu等开发出GSM151 KASP标记,可用于筛选出具有胞囊线虫抗性的品种[10]。为了收集大豆中已经报道重要性状基因功能位点,开发相应的KASP标记,构建大豆基因型快速鉴定平台,提高大豆分子标记辅助选择效率,本研究根据大豆中已报道的重要性状相关基因Dt1、Ln、Pdh1、GmSSS1、GmST05、J、GmPRR3a、GmPRR3b、GmFUL2a、GmLHY1a、GmLHY1b、GmSOC1a、E4、GmSWEET39、GmCCD4、GmPHF1、GmGLP20.4、Rj2和GmCKX7-1的功能位点,设计开发了22个KASP标记(表2),并利用已知基因型品种进行测序,验证标记分型的准确性。验证结果表明,除e4-sore大片段标记不能区分杂合样本外,其余21个KASP标记均表现出较高水平的基因分型准确性,可以在未来大豆育种中加以应用。
目前,有关功能位点对表型的选择效率报道较少。本实验根据收集的结荚习性、叶形、多粒荚、炸荚性和开花期表型信息分别对dt1-ta、dt1-ab、dt1-tb、dt1-bb,ln,pdh1,prr3a、prr3b、ful2a、lhy1a、lhy1b和soc1a标记表型选择效率进行了分析。结果显示结荚习性的4个标记dt1-ta、dt1-ab、dt1-tb和dt1-bb对结荚习性的选择效率为87.4%;ln标记对多粒荚的选择效率84.0%,对叶形的选择效率为94.8%。Dt1和Ln两个基因座上设计的功能标记均表现出较高的表型预测水平,这进一步证明了功能位点在育种中具有极高的应用价值。关于,本实验中结荚习性的4个标记dt1-ta、dt1-ab、dt1-tb和dt1-bb对结荚习性的综合选择效率为87.4%而非100%,可能是由于Dt1基因的两种新单倍型所致[35]。而ln标记对叶形的选择效率为94.8%而非100%,可能是由于在表型收集时,不同人员对相近表型(大片披针叶与卵圆叶)存在辨别差异所造成。以上结荚习性、叶形、多粒荚性状均为单基因控制的质量性状,而开花期则是由多基因调控的、复杂的数量性状。本实验结合开花期数据对prr3a、prr3b、ful2a、lhy1a、lhy1b和soc1a标记进行了单因素方差分析,意图研究能否利用单一功能标记对数量性状的表型进行预测、比较。其中,prr3a、prr3b、lhy1a和soc1a标记表型鉴定结果与报道一致,且等位基因间表现出显著差异[17,18,20,22],lhy1b标记表型鉴定结果与报道一致,但等位基因间并未表现出明显差异[21],ful2a标记表型鉴定结果与报道不一致[19]。以上结果,可能是由于群体结构不同,造成lhy1b和ful2a标记表型鉴定结果存在差异。同时,通过遗传背景分析发现,ful2a标记表型鉴定结果与报道不一致,也受到了其他主效开花基因(如E1-E4)的影响[5]。以上结果说明,质量性状可以通过功能标记的分型结果来预测表型,并且受环境影响较小,预测准确率较高。但对于复杂的数量性状,利用单基因功能标记预测表型是不准确的,需要结合基因组信息以及环境信息进行综合分析,例如目前较流行的全基因组选择(genomic selection,GS)是利用高密度分子标记对个体进行估算,在较高预测准确性上对多基因控制的数量性状进行预测,已在玉米[36, 37]、水稻[38]、小麦[39, 40]等作物中进行了应用。
现阶段,针对DNA大片段Indel的检测方法通常采用常规引物PCR扩增结合琼脂糖凝胶电泳检测观察条带[2,41]。该方法虽然技术简单,但是检测的样本数量受制于电泳槽数量,无法实现高通量,一旦样本数量过大,检测过程将十分复杂。本实验中,分别对GmST05和E4大片段Indel设计了KASP标记,以期为大片段Indel提供一种高通量的检测方法。在针对大片段设计KASP标记时,发现GmST05基因缺失片段前后碱基不同,因而采取引物3’末端携带不同碱基的常规设计方法,最终开发出的st05标记可以准确地区分纯合和杂合基因型,如图2D所示。然而,E4-SORE-1大片段插入前后碱基相同,且插入片段(6 238 bp)远大于引物长度(20-30 bp),无法采用常规KASP引物设计方法设计标记。所以,本实验基于KASP技术原理,对E4大片段插入标记的设计方法进行了改良,采用2条特异引物和2条通用引物的设计思路。2条特异引物分别在3’末端携带插入/缺失片段前2个碱基,2条通用引物分别位于插入片段内和插入片段外以便更好地进行匹配扩增,最终开发出的e4-sore标记成功对插入/缺失纯合样本进行分型,如图3H所示。但由于e4-sore标记的2条通用引物序列差异较大,引物对之间扩增能力存在差异,会将杂合基因型误判为纯合基因型。e4-sore标记虽无法区分杂合样本,但可对纯合样本进行高通量、准确的基因型鉴定,同时为研究人员多提供一种Indel鉴定方法以及大片段KASP引物设计思路,为未来改良、创制新型基因分型技术提供一定的参考。
综上,本实验利用KASP技术开发的功能标记,覆盖性状广泛,在基因分型和表型预测方面的准确性较高。结合已有的功能标记[5,7-10],目前基于KASP技术的大豆基因型鉴定平台已经初具规模,涵盖多个重要性状,包括植株形态(结荚习性、多粒荚、炸荚性、籽粒大小),开花期和成熟期,品质(油酸含量、亚油酸含量、水苏糖含量、棉子糖含量、胡萝卜素含量,脂肪氧化酶活性、胰蛋白酶抑制剂活性),养分利用效率(磷利用效率、氮利用效率),激素(细胞分裂素)合成,抗病性(胞囊线虫抗性)、耐逆性(耐盐碱)等方面,并且其操作简单、分型准确,可在大豆育种中广泛应用,大幅度提高育种效率。