生物数学中的基因表达随机热力学非平衡信息流模型
字数 1172 2025-11-26 12:47:39

生物数学中的基因表达随机热力学非平衡信息流模型

  1. 基础概念:基因表达随机性与热力学非平衡性
    在生物数学中,基因表达过程具有显著的随机性,表现为 mRNA 和蛋白质水平的波动。这种随机性可通过化学主方程或朗之万方程描述。同时,细胞系统处于热力学非平衡态,需持续消耗能量(如 ATP 水解)以驱动转录、翻译等过程。随机热力学为结合随机性与非平衡热力学提供了框架,其中熵产生率是系统不可逆性的量化指标。

  2. 信息流的引入与量化
    信息流描述系统中不同组分间因果关系的强度,例如从转录因子到目标基因的信息传递。在随机热力学框架下,信息流可通过转移熵或动态互信息的时间导数定义。以基因调控网络为例,从调控因子 \(X\) 到目标基因 \(Y\) 的信息流 \(I_{X \to Y}\) 计算为:

\[ I_{X \to Y} = \frac{d}{dt} I(X_t; Y_t) - \left\langle \frac{\partial \log P(y_t|x_t)}{\partial t} \right\rangle, \]

其中 \(I(X_t; Y_t)\)\(X_t\)\(Y_t\) 的互信息,第二项表征 \(Y\) 自身动态的贡献。

  1. 非平衡稳态下的信息-热力学关系
    在非平衡稳态中,信息流与热力学熵产生存在内在关联。例如,调控过程消耗的能量(以熵产生率 \(\dot{S}\) 表示)需满足信息-热力学不等式:

\[ I_{X \to Y} \leq \frac{\dot{S}}{k_B}, \]

其中 \(k_B\) 为玻尔兹曼常数。该不等式表明,信息流的上限由系统能耗决定,体现了生物系统在能量约束下的信息处理能力。

  1. 模型构建与动力学模拟
    以双基因调控模块为例,建立随机微分方程组:

\[ \begin{aligned} dx &= [f_x(y) - \gamma_x x] dt + \sigma_x dW_x, \\ dy &= [f_y(x) - \gamma_y y] dt + \sigma_y dW_y, \end{aligned} \]

其中 \(f_x, f_y\) 为调控函数,\(\gamma\) 为降解率,\(\sigma\) 为噪声强度,\(dW\) 为维纳过程。通过随机模拟(如欧拉-丸山法)生成轨迹,并计算瞬时信息流与熵产生率。

  1. 应用与生物意义
    该模型可用于分析基因网络的调控效率。例如,在细胞分化中,信息流可量化主调控基因对下游靶点的控制强度;在应激响应中,高信息流可能对应快速信号传递,但需付出更高能量代价。通过优化信息流与能耗的权衡,可揭示生物系统在进化中形成的适应性策略。
生物数学中的基因表达随机热力学非平衡信息流模型 基础概念:基因表达随机性与热力学非平衡性 在生物数学中,基因表达过程具有显著的随机性,表现为 mRNA 和蛋白质水平的波动。这种随机性可通过化学主方程或朗之万方程描述。同时,细胞系统处于热力学非平衡态,需持续消耗能量(如 ATP 水解)以驱动转录、翻译等过程。随机热力学为结合随机性与非平衡热力学提供了框架,其中熵产生率是系统不可逆性的量化指标。 信息流的引入与量化 信息流描述系统中不同组分间因果关系的强度,例如从转录因子到目标基因的信息传递。在随机热力学框架下,信息流可通过转移熵或动态互信息的时间导数定义。以基因调控网络为例,从调控因子 \( X \) 到目标基因 \( Y \) 的信息流 \( I_ {X \to Y} \) 计算为: \[ I_ {X \to Y} = \frac{d}{dt} I(X_ t; Y_ t) - \left\langle \frac{\partial \log P(y_ t|x_ t)}{\partial t} \right\rangle, \] 其中 \( I(X_ t; Y_ t) \) 是 \( X_ t \) 与 \( Y_ t \) 的互信息,第二项表征 \( Y \) 自身动态的贡献。 非平衡稳态下的信息-热力学关系 在非平衡稳态中,信息流与热力学熵产生存在内在关联。例如,调控过程消耗的能量(以熵产生率 \( \dot{S} \) 表示)需满足信息-热力学不等式: \[ I_ {X \to Y} \leq \frac{\dot{S}}{k_ B}, \] 其中 \( k_ B \) 为玻尔兹曼常数。该不等式表明,信息流的上限由系统能耗决定,体现了生物系统在能量约束下的信息处理能力。 模型构建与动力学模拟 以双基因调控模块为例,建立随机微分方程组: \[ \begin{aligned} dx &= [ f_ x(y) - \gamma_ x x] dt + \sigma_ x dW_ x, \\ dy &= [ f_ y(x) - \gamma_ y y] dt + \sigma_ y dW_ y, \end{aligned} \] 其中 \( f_ x, f_ y \) 为调控函数,\( \gamma \) 为降解率,\( \sigma \) 为噪声强度,\( dW \) 为维纳过程。通过随机模拟(如欧拉-丸山法)生成轨迹,并计算瞬时信息流与熵产生率。 应用与生物意义 该模型可用于分析基因网络的调控效率。例如,在细胞分化中,信息流可量化主调控基因对下游靶点的控制强度;在应激响应中,高信息流可能对应快速信号传递,但需付出更高能量代价。通过优化信息流与能耗的权衡,可揭示生物系统在进化中形成的适应性策略。