生物数学中的基因表达随机热力学非平衡信息流模型
-
基础概念:基因表达随机性与热力学非平衡性
在生物数学中,基因表达过程具有显著的随机性,表现为 mRNA 和蛋白质水平的波动。这种随机性可通过化学主方程或朗之万方程描述。同时,细胞系统处于热力学非平衡态,需持续消耗能量(如 ATP 水解)以驱动转录、翻译等过程。随机热力学为结合随机性与非平衡热力学提供了框架,其中熵产生率是系统不可逆性的量化指标。 -
信息流的引入与量化
信息流描述系统中不同组分间因果关系的强度,例如从转录因子到目标基因的信息传递。在随机热力学框架下,信息流可通过转移熵或动态互信息的时间导数定义。以基因调控网络为例,从调控因子 \(X\) 到目标基因 \(Y\) 的信息流 \(I_{X \to Y}\) 计算为:
\[ I_{X \to Y} = \frac{d}{dt} I(X_t; Y_t) - \left\langle \frac{\partial \log P(y_t|x_t)}{\partial t} \right\rangle, \]
其中 \(I(X_t; Y_t)\) 是 \(X_t\) 与 \(Y_t\) 的互信息,第二项表征 \(Y\) 自身动态的贡献。
- 非平衡稳态下的信息-热力学关系
在非平衡稳态中,信息流与热力学熵产生存在内在关联。例如,调控过程消耗的能量(以熵产生率 \(\dot{S}\) 表示)需满足信息-热力学不等式:
\[ I_{X \to Y} \leq \frac{\dot{S}}{k_B}, \]
其中 \(k_B\) 为玻尔兹曼常数。该不等式表明,信息流的上限由系统能耗决定,体现了生物系统在能量约束下的信息处理能力。
- 模型构建与动力学模拟
以双基因调控模块为例,建立随机微分方程组:
\[ \begin{aligned} dx &= [f_x(y) - \gamma_x x] dt + \sigma_x dW_x, \\ dy &= [f_y(x) - \gamma_y y] dt + \sigma_y dW_y, \end{aligned} \]
其中 \(f_x, f_y\) 为调控函数,\(\gamma\) 为降解率,\(\sigma\) 为噪声强度,\(dW\) 为维纳过程。通过随机模拟(如欧拉-丸山法)生成轨迹,并计算瞬时信息流与熵产生率。
- 应用与生物意义
该模型可用于分析基因网络的调控效率。例如,在细胞分化中,信息流可量化主调控基因对下游靶点的控制强度;在应激响应中,高信息流可能对应快速信号传递,但需付出更高能量代价。通过优化信息流与能耗的权衡,可揭示生物系统在进化中形成的适应性策略。