摘要
物种驯化通常的特点是通过涉及驯化物种复杂变化的人口统计数据的过程来利用高影响的突变。
这些不仅包括可能导致进化瓶颈出现的近亲繁殖和人工选择,还包括分化后的基因流动和渗入。
尽管驯化可能会影响期望和不希望的突变的发生,但驯化物种的野生亲缘种进化方式以及驯化背后的遗传成本的昂贵程度仍然知之甚少。
在这里,我们调查了鸡驯化的人口历史和遗传负荷。同时分析了一个数据集,其中包含来自本土鸡和野生丛林家禽的800多个全基因组。
我们表明,尽管具有比野生鸡更高的遗传多样性(平均π,0.00326对0.00316),但红丛林鸡,今天的家鸡在早期驯化期间经历了急剧的种群规模下降。
我们的分析表明,与红丛林鸡相比,伴随的瓶颈在鸡基因组中诱导的有害突变多2.95%,支持了“驯化成本”假说。
特别是,我们发现家鸡中62.4%的有害SNP维持在杂合状态并被掩盖为隐性等位基因,挑战了现代育种计划有效消除这些遗传负荷的力量。
最后,我们认为正向选择降低了家鸡基因组中有害SNP的发生率,但增加了有害SNP的频率。
这项研究揭示了与鸡驯化相关的人口历史和基因组变化的新景观,并提供了对现代人类选择下驯养动物的进化基因组图谱的见解。
结果
鸡驯化瓶颈的证据
为了获得有关当今家鸡和GGS基因组多样性的基线信息,我们估计了每个种群的核苷酸多样性(π)。
所有家鸡的平均π为3.26e−3,略高于GGS(平均值3.16e−3;P < 2.2e−16,威尔科克森符号秩检验;图1a)。
我们注意到,应该谨慎解释这一结果,因为我们对GGS的采样可能没有涵盖它们所有的遗传多样性,而我们的鸡肉样品来自横跨欧亚大陆的广泛采样。
将这些不同鸡种群的基因组汇总分析可能会夸大遗传多样性的估计(图S1)。
我们使用成对顺序马尔可夫合并(P *** C) *** 来估计家鸡和GGS的历史有效种群大小(Ne)。
由于该分析的效率依赖于跨基因组的杂合子,因此低覆盖率基因组的结果不可靠。
1K CGP中的高覆盖率基因组数量有限,因此我们还在本分析中纳入了最近发表的鸡基因组,覆盖率为≥20倍(图1)。
我们的数据包含来自GGS和18个鸡群的基因组,包括商业品种(白里霍恩鸡,白隐性岩鸡,罗德岛红鸡和科布鸡),埃塞俄比亚,斯里兰卡,老挝和中国当地鸡。估计值按每个位点每年1.91e−9个替换率和1年的生成时间来缩放。
P *** C显示,家鸡和GGS在20万年前(kya)之前具有几乎相同的人口历史(图S2),这是可以预期的,因为鸡起源于GGS。
具体来说,在1万年前(Mya)开始,鸡和GGS的Ne显示出膨胀并达到更大约100 kya,然后连续收缩直到20 kya。
过去种群扩张和收缩的周期与其他野生鸟类相似,支持了第四纪气候波动可能塑造了许多鸟类物种的进化和物种形成的说法。
然而,P *** C在10 kya内揭示最近的Ne的能力有限。
然后,我们使用了M *** C ,这是一种类似于P *** C的 *** ,它可以为每个种群分析来自多个个体的基因组,因此具有增强的能力来推断相对较新的进化事件(如驯化)的人口变化。
我们的估计基于每个群体的四个单倍型基因组(两个个体)。与P *** C一致,M *** C显示18个鸡种群和GGS在100至20 kya之间具有可比且显着的Ne收缩(图1b)。
此后,鸡肉和GGS表现出明显的分化。
具体而言,GGS的Ne在快速下降~8 kya之前保持相对稳定,但随后稳定~4 kya,而家鸡表现出持续的Ne下降,直到云南当地鸡和云南野鸡恢复~6-7 kya,其他鸡种群恢复后~2-4 kya。
商业鸡品种,包括白隐性岩石鸡、科布鸡、白里霍恩鸡和罗德岛红鸡,其 Ne 比其他鸡小得多,它们的 Ne 恢复得更晚(~2 kya),这与商业鸡受到强化人工选择和近亲繁殖的事实一致。
应该注意的是,M *** C估计的最近的Ne倾向于膨胀,特别是在分析两个以上的单倍型时。
在这里,我们使用 *** C++进一步推断了GGS和每个鸡种群的历史Ne ,这是一种基于多个基因组估计人口历史的 *** ,无需分阶段。
对于每个种群,我们允许五个基因组的测序覆盖率超过15倍,从我们当前的数据集中总共产生17个鸡种群进行分析(图1c)。
该分析还揭示了与GGS相比鸡驯化瓶颈的有力证据,与M *** C的结果大致一致。
与M *** C相比, *** C++在估计最近的人口历史方面具有更高的分辨率。
例如, *** C++分析还显示,与其他鸡相比,商业鸡(白里格霍恩鸡,白隐岩鸡,罗德岛红鸡和科布鸡)具有更强的瓶颈和更小的近期Ne。
Ne for 云南地方鸡、溧阳鸡、白隐岩鸡、斯里兰卡当地鸡、埃塞俄比亚当地鸡和野鸡在 10 庆期间出现瓶颈后最近有所恢复。
由于P *** C,M *** C和 *** C++没有考虑混合的可能影响,因此Ne分化的估计起始不一定与分裂时间相关。
为了进一步推断家鸡的进化历史,我们使用dadi 来拟合家鸡和GGS种群之间的联合位点频谱(SFS)。
我们测试了四个假设的人口统计模型(图S3-S4和表S2-S3),发现模型3的可能性更高(图1d),表明其最适合观察到的SFS。
在这个模型下,我们估计现代家鸡和GGS在~12300年前彼此分离(95%置信区间(CI)10800-15500)。
之后,直到10,300年前,GGS在Ne中略有扩张(95%CI 9300-12700),随后从约257000只减少到154000只,这可能是由于最近的栖息地丧失和过度狩猎造成的。
相反,家鸡的平均Ne从与GGS分离时的约138,000只急剧下降到52,000只,直到~6990(6900-8900)年前,当它们开始恢复到~152,000只鸟直到今天。
M *** C, *** C++和dadi分析表明,家鸡自从GGS分离出来以来经历了持续的Ne下降,表明鸡驯化存在瓶颈。
我们注意到,与当地丛林鸡或其他家鸡种群的混合是普遍的,这可能会影响人口历史的推断,因此我们在这里估计的瓶颈时间尚无定论。
鉴定高影响突变
为了衡量驯化相关的瓶颈是否可能诱导鸡基因组中高影响SNPs(hSNPs)的上升,我们分析了1K CGP中家鸡和GGS基因组中称为的变异。
我们发现蛋白质编码区占鸡基因组的~4.2%,1.6%的基因组变异(435919)存在于这些外显子区(图2a),几乎是在其他家畜(包括狗、猪、牛和马)中观察到的两倍(图4)。
这些外显子变异在家鸡和GGS之间仅略有区别,这表明它们受到了进化的限制。
我们将外显子区域的突变分为非同义和同义替换,并鉴定了146,193个非同义SNP,约占总外显子SNP的33.5%。非同义SNP数量与外显子SNP的估计比率与其他家畜中观察到的相似(图4)。
为了评估它们对家鸡蛋白质序列中相关氨基酸变化的潜在影响(即耐受性或有害性),我们进行了PROVEAN分析。
基于分数阈值≤-2.5,我们检测到22,282个潜在的hSNP(图2b)。与哺乳动物相比,鸟类染色体的大小变化很大。鸡染色体分为5类,包括1条大染色体(chrs:5-28)、11条微染色体(chrs:38-4)和6条中间染色体(chrs:10-51)。
我们比较了非同义突变的PROVEAN评分,发现变异对微染色体的平均PROVEAN评分(破坏性影响)明显低于其余染色体(图4)。
这一发现与之前的报告一致,即微染色体因其较高的重组率而受到进化约束或更有效的纯化选择,因此,保守区域的突变更有可能是有害的。
为了评估相关基因的潜在生物学作用,我们检索了携带PROVEAN评分<-10的非同义SNP的基因,并进行了功能富集分析,包括GO和人类表型本体(HPO)。
共检索到346个蛋白质编码基因,它们涉及多种功能性GO和HPO类别,包括神经系统生理异常,生长,骨骼和肌肉发育和形态,心血管和呼吸系统,代谢/稳态,视力和免疫力(表S5,图2c)。
这些突变在家鸡中频率较低,其中大多数可能与现代家禽业面临的健康问题有关,因为高产鸟类一直患有骨骼脆弱,失明,腿部疾病,腹水(肺和心脏疾病)和猝死综合症。
然而,其中一些可能是驯化和/或最近遗传改良或特定性状育种期间正向选择的目标。
家鸡遗传负荷增加
为了比较家鸡和GGS之间的遗传负荷水平,我们评估了非同义和同义SNP的数量和频率以及其基因组中的hSNP(图4)。
我们的结果表明,每只鸡在其基因组中携带的hSNP比GGS多约2.95%(P = 0.01865,Wilcoxon符号秩检验;图4).。
家鸡的hSNPs相对于同义SNPs的比例也显著更高(P = 1.83e−6,Wilcoxon符号秩检验;图4)。
特别是家鸡hSNPs的平均等位基因频率显著高于GGS(P < 2.2e−16,Wilcoxon符号秩检验;图4)。
我们之前的研究表明,在起源于GGS之后,家鸡在分散到驯化中心的过程中进一步与其他丛林鸡混合。
鸡和当地丛林鸡之间的基因流动幅度更大,这可能会对遗传负荷的估计产生偏差。
我们进一步测量了一些潜在漂移和/或孤立种群中hSNP的数量和比率,没有丛林家禽分布在其自然范围内。
为了更大化每个种群的更多样本,我们选择了藏鸡、北京游鸡、丝鸡、中国新疆鸡和白里窝鸡进行比较。
有害突变相对于同义突变的比率和杂合有害突变的水平在这些鸡种群中有所不同,但都高于GGS。
总的来说,这些分析表明,驯化导致了高影响突变的快速积累,因此,hSNPs定义的遗传负担/负荷可能在家鸡中增加。
接下来,我们比较了纯合和杂合状态下的hSNPs水平,并观察到家鸡中62.4%的hSNPs在杂合子状态下维持,显着高于GGS(57.8%;P = 0.00584,威尔科克森符号秩检验;图4)。
此外,家鸡携带更多的杂合hSNP(P = 0.00596,Wilcoxon符号秩检验),但较少的纯合hSNP(P = 0.0542,Wilcoxon符号秩检验;图4)比GGS(图4)。
然而,家鸡和GGS的同义等位基因数量以及每个基因组杂合状态的等位基因数量相当(P = 0.5449和0.2239,Wilcoxon符号秩检验)。
GGS纯合同义等位基因总数高于家鸡(P = 2.91e−11,Wilcoxon符号秩检验;图4)。
同样,我们测量了藏鸡、北京游鸡、丝鸡、中国新疆鸡和白里窝鸡的杂合hSNPs水平,发现这些人群的杂合hSNPs的比例和数量也高于GGS。
这些结果表明,家鸡杂合突变负荷升高。
总结
总之,我们系统地表征了鸡中遗传多样性的驯化前丧失以及驯化瓶颈的存在,导致家鸡基因组中高影响力等位基因的突出。
通过功能性状分析,我们认为这些高影响力的等位基因会影响行为、发育和形态,我们的研究结果表明,这些等位基因部分处于人工选择压力下,而有害变异的频率由于漂移而增加。
这项研究为鸡基因组学翻开了新的一页,呼吁更加关注特定品种和野生谱系的比较基因组多样性,并对高影响等位基因进行深入的功能分析,以了解哪些有助于特定性状的驯化和遗传改良,哪些是适应不良的。
这将能够开发可靠的标记,用于监测遗传改良和清除有害突变对鸡基因组进化的具体影响。
此外,我们对世界上最依赖驯化物种之一的瓶颈和恢复过程的年代测定,对于理解过去被利用的欧亚大陆物种群的生物文化相互作用、易位和驯化实践具有广泛的意义。
我们的研究为使用育种实验和更大规模的基因组进一步研究提供了可能性,涵盖了更广泛的全球鸡和化石样本。
参考文献
Bosse M, Megens HJ, Derks MFL, de Cara AMR, Groenen MAM.驯化、近亲繁殖和选择背景下的有害等位基因。应用学报 2019;12(1):6–17
Makino T,Rubin CJ,Carneiro M,Axelsson E,Andersson L,Webster MT.家畜和植物中有害遗传变异的比例升高。基因组生物学 Evol.2018;10(1):276–90
Agrawal AF,Whitlock MC.从酵母基因敲除数据中得出的关于优势分布的推断。遗传学。2011;187(2):553–66
标签: 鸡的基因组大小是多少 家鸡基因型 鸡的基因组大小