生物数学中的群体遗传学模型
群体遗传学模型是生物数学中研究种群遗传结构变化规律的核心工具。接下来我将从基础概念到复杂模型逐步展开说明。
第一步:基本概念与哈代-温伯格平衡
群体遗传学模型的基础是描述等位基因频率在种群中的变化规律。最基础的模型是哈代-温伯格平衡模型,它建立在以下假设条件下:
- 种群无限大
- 个体随机交配
- 没有突变、迁移和选择
其数学表达式为:若某基因座有两个等位基因A和a,频率分别为p和q(p+q=1),则基因型AA、Aa、aa的频率将稳定在p²、2pq、q²。该模型的重要性在于建立了种群遗传变化的基准状态,任何偏离都意味着进化力量的存在。
第二步:引入进化力量的基本模型
实际种群会受四种进化力量影响,需分别建立数学模型:
- 自然选择模型:设基因型AA、Aa、aa的相对适应度为w₁₁、w₁₂、w₂₂,则等位基因A的频率变化为Δp = [p²w₁₁ + pqw₁₂ - p(w)] / w̄,其中w̄为平均适应度
- 突变模型:设A→a的突变率为u,a→A为v,则微分方程dp/dt = -pu + qv描述频率变化
- 迁移模型:若迁入个体比例为m,迁入群体中A频率为pₘ,则Δp = m(pₘ - p)
- 遗传漂变模型:通过Wright-Fisher模型描述,假设二倍体种群大小为N,等位基因频率在世代间遵循二项分布
第三步:多位点模型与连锁不平衡
当研究多个基因座时,需考虑连锁不平衡(LD)。设两个基因座各有等位基因A/a和B/b,单倍型频率为p(AB)、p(Ab)、p(aB)、p(ab)。连锁不平衡度量D = p(AB) - p(A)p(B),其衰减模型为Dₜ = D₀(1-r)ᵗ,其中r为重组率。该模型揭示了重组如何打破基因间的关联,是理解基因组进化的重要基础。
第四步:空间结构化模型
针对地理分布的种群,常用岛屿模型和隔离距离模型:
- 岛屿模型:将种群分为多个亚群,迁移率恒定,用矩阵描述基因流
- 隔离距离模型:基因流与距离负相关,常用公式mᵢⱼ = k exp(-dᵢⱼ/δ),其中dᵢⱼ为距离,δ为尺度参数
这些模型通过F统计量(如Fₛₜ)量化种群分化程度,揭示空间结构对遗传多样性的影响。
第五步:溯祖理论与中性检验
基于溯祖理论的Coalescent模型是分析基因序列数据的核心框架。该模型反向模拟基因谱系的合并过程,两个谱系在t代前合并的概率为P(t) = (1/2N)e^(-t/2N)。由此发展出Tajima's D、Fu & Li's F等中性检验统计量,用于检测自然选择:
Tajima's D = (π - θₛ)/Var(π - θₛ)
其中π为平均配对差异,θₛ基于 segregating sites数。显著偏离零表明可能存在平衡选择或群体扩张。
第六步:现代全基因组模型
当前研究整合了选择、漂变、重组等多因素,如近似贝叶斯计算(ABC)模型:通过模拟生成大量伪数据集,比较摘要统计量与真实数据的匹配度,用接受-拒绝算法估计参数后验分布。同时,时空扩散模型如BEAST软件使用的贝叶斯系统地理学方法,能联合估计种群历史动态和迁移事件。