卡方检验
字数 2182 2025-12-10 13:37:42

卡方检验

卡方检验是一种基于卡方分布的统计假设检验方法,主要用于分析分类变量之间的关联性或比较观测频数与期望频数之间的差异。让我们从最基础的概念开始,逐步深入。

第一步:核心思想与基本场景
卡方检验的核心思想是衡量“观测”与“理论”之间的差异。最典型的应用场景是“拟合优度检验”和“独立性检验”。

  1. 拟合优度检验:检验一个样本的分布形状是否与某个理论分布(如均匀分布、正态分布)相符。例如,掷一个六面骰子60次,检验其是否均匀(即每个面出现次数是否接近10次)。
  2. 独立性检验:检验两个分类变量之间是否相互独立。例如,检验性别(男/女)与对某产品的偏好(喜欢/不喜欢)是否有关联。

这两个检验的底层逻辑是一致的:比较实际观测到的频数(Observed Frequency, O)与在某个假设(如“分布符合理论”或“变量相互独立”)下计算出的期望频数(Expected Frequency, E)。

第二步:卡方统计量的计算
差异的度量通过卡方统计量来实现。其计算公式为:

\[\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i} \]

其中:

  • \(O_i\) 是第 \(i\) 个类别或单元格中的观测频数。
  • \(E_i\) 是第 \(i\) 个类别或单元格中的期望频数。
  • 求和是对所有的类别或列联表中的所有单元格进行。

这个公式的设计精妙之处在于:

  • \((O_i - E_i)\) 衡量绝对差异。
  • 平方项 \((O_i - E_i)^2\) 消除了正负号的影响,将所有差异转为非负。
  • 除以 \(E_i\) 进行了标准化,使得不同基数(期望频数不同)的差异可以相加。例如,观测5、期望10的差异(5),与观测50、期望100的差异(50),其相对差异程度是一样的,计算出的 \((O-E)^2/E\) 值都是25/10=2.5。

第三步:期望频数E的计算
这是卡方检验的关键步骤,计算方式取决于检验类型。

  1. 拟合优度检验:期望频数由理论分布给出。例如检验骰子均匀性,理论概率是1/6,总投掷次数是N,则每个面的期望频数 \(E_i = N \times (1/6)\)
  2. 独立性检验(列联表):假设两个变量独立,期望频数基于行列边际和计算。对于一个 \(r\)\(c\) 列的列联表,第 \(i\) 行第 \(j\) 列单元格的期望频数为:

\[ E_{ij} = \frac{(第i行的总和) \times (第j列的总和)}{总样本量N} \]

这个公式源于概率的乘法公式:如果变量独立,则单元格的概率等于行边缘概率乘以列边缘概率。

第四步:卡方分布与假设检验
计算出的卡方统计量本身只是一个数字。我们需要一个基准来判断这个差异是否“足够大”以至于可以拒绝原假设。这个基准就是卡方分布

  • 卡方分布:是统计学中一个非常重要的连续概率分布。如果 \(k\) 个独立的标准正态随机变量,它们的平方和服从自由度为 \(k\) 的卡方分布。
  • 自由度:这是卡方分布的关键参数。在卡方检验中,自由度(df)的计算方式不同:
  • 拟合优度检验\(df = \text{类别数} - 1 - \text{利用数据估计的参数个数}\)。例如检验均匀分布(无需估计参数),有6个类别,则 \(df = 6-1=5\)
  • 独立性检验:对于一个 \(r \times c\) 的列联表,\(df = (r-1) \times (c-1)\)。例如2x2表的自由度为1。
  • 假设检验过程
  1. 建立原假设 \(H_0\)(如“变量独立”或“分布符合理论”)和备择假设 \(H_1\)
  2. 选择一个显著性水平 \(\alpha\)(如0.05)。
  3. 根据公式计算卡方统计量 \(\chi^2_{calc}\) 和相应的自由度 \(df\)
  4. 查询卡方分布表(或使用软件),找到在自由度为 \(df\)、右侧尾部面积为 \(\alpha\) 时的临界值 \(\chi^2_{\alpha, df}\)。或者计算p值:\(P(\chi^2(df) > \chi^2_{calc})\)
    5. 做出决策:
  • \(\chi^2_{calc} > \chi^2_{\alpha, df}\)(或p值 < \(\alpha\)),则拒绝 \(H_0\),认为观测与期望有显著差异。
  • 否则,不拒绝 \(H_0\)

第五步:应用前提与注意事项
卡方检验并非万能,它有明确的适用条件:

  1. 数据是频数/计数数据:处理的是分类变量各个类别的发生次数。
  2. 样本是随机、独立的
  3. 期望频数不能太小:这是一个关键且常见的要求。经验法则是,所有单元格的期望频数 \(E_i\) 都应至少大于5。如果某些单元格期望频数过小,检验结果会不可靠。对于2x2表,通常要求总样本量>40且所有期望频数>5。当期望频数过小时,可以考虑费希尔精确检验作为替代。

总结:卡方检验通过比较观测频数与期望频数,构造一个服从卡方分布的统计量,从而对分类数据的分布拟合优度或变量间独立性进行统计推断。其核心步骤是:根据假设计算期望频数 -> 计算卡方统计量 -> 根据自由度和卡方分布判断显著性。使用时务必注意其适用条件,特别是期望频数的要求。

卡方检验 卡方检验是一种基于卡方分布的统计假设检验方法,主要用于分析分类变量之间的关联性或比较观测频数与期望频数之间的差异。让我们从最基础的概念开始,逐步深入。 第一步:核心思想与基本场景 卡方检验的核心思想是衡量“观测”与“理论”之间的差异。最典型的应用场景是“拟合优度检验”和“独立性检验”。 拟合优度检验 :检验一个样本的分布形状是否与某个理论分布(如均匀分布、正态分布)相符。例如,掷一个六面骰子60次,检验其是否均匀(即每个面出现次数是否接近10次)。 独立性检验 :检验两个分类变量之间是否相互独立。例如,检验性别(男/女)与对某产品的偏好(喜欢/不喜欢)是否有关联。 这两个检验的底层逻辑是一致的:比较实际观测到的频数(Observed Frequency, O)与在某个假设(如“分布符合理论”或“变量相互独立”)下计算出的期望频数(Expected Frequency, E)。 第二步:卡方统计量的计算 差异的度量通过卡方统计量来实现。其计算公式为: \[ \chi^2 = \sum \frac{(O_ i - E_ i)^2}{E_ i} \] 其中: \(O_ i\) 是第 \(i\) 个类别或单元格中的观测频数。 \(E_ i\) 是第 \(i\) 个类别或单元格中的期望频数。 求和是对所有的类别或列联表中的所有单元格进行。 这个公式的设计精妙之处在于: \((O_ i - E_ i)\) 衡量绝对差异。 平方项 \((O_ i - E_ i)^2\) 消除了正负号的影响,将所有差异转为非负。 除以 \(E_ i\) 进行了标准化,使得不同基数(期望频数不同)的差异可以相加。例如,观测5、期望10的差异(5),与观测50、期望100的差异(50),其相对差异程度是一样的,计算出的 \((O-E)^2/E\) 值都是25/10=2.5。 第三步:期望频数E的计算 这是卡方检验的关键步骤,计算方式取决于检验类型。 拟合优度检验 :期望频数由理论分布给出。例如检验骰子均匀性,理论概率是1/6,总投掷次数是N,则每个面的期望频数 \(E_ i = N \times (1/6)\)。 独立性检验(列联表) :假设两个变量独立,期望频数基于行列边际和计算。对于一个 \(r\) 行 \(c\) 列的列联表,第 \(i\) 行第 \(j\) 列单元格的期望频数为: \[ E_ {ij} = \frac{(第i行的总和) \times (第j列的总和)}{总样本量N} \] 这个公式源于概率的乘法公式:如果变量独立,则单元格的概率等于行边缘概率乘以列边缘概率。 第四步:卡方分布与假设检验 计算出的卡方统计量本身只是一个数字。我们需要一个基准来判断这个差异是否“足够大”以至于可以拒绝原假设。这个基准就是 卡方分布 。 卡方分布 :是统计学中一个非常重要的连续概率分布。如果 \(k\) 个独立的标准正态随机变量,它们的平方和服从自由度为 \(k\) 的卡方分布。 自由度 :这是卡方分布的关键参数。在卡方检验中,自由度(df)的计算方式不同: 拟合优度检验 :\(df = \text{类别数} - 1 - \text{利用数据估计的参数个数}\)。例如检验均匀分布(无需估计参数),有6个类别,则 \(df = 6-1=5\)。 独立性检验 :对于一个 \(r \times c\) 的列联表,\(df = (r-1) \times (c-1)\)。例如2x2表的自由度为1。 假设检验过程 : 建立原假设 \(H_ 0\)(如“变量独立”或“分布符合理论”)和备择假设 \(H_ 1\)。 选择一个显著性水平 \(\alpha\)(如0.05)。 根据公式计算卡方统计量 \(\chi^2_ {calc}\) 和相应的自由度 \(df\)。 查询卡方分布表(或使用软件),找到在自由度为 \(df\)、右侧尾部面积为 \(\alpha\) 时的临界值 \(\chi^2_ {\alpha, df}\)。或者计算p值:\(P(\chi^2(df) > \chi^2_ {calc})\)。 做出决策: 若 \(\chi^2_ {calc} > \chi^2_ {\alpha, df}\)(或p值 < \(\alpha\)),则拒绝 \(H_ 0\),认为观测与期望有显著差异。 否则,不拒绝 \(H_ 0\)。 第五步:应用前提与注意事项 卡方检验并非万能,它有明确的适用条件: 数据是频数/计数数据 :处理的是分类变量各个类别的发生次数。 样本是随机、独立的 。 期望频数不能太小 :这是一个关键且常见的要求。经验法则是,所有单元格的期望频数 \(E_ i\) 都应至少大于5。如果某些单元格期望频数过小,检验结果会不可靠。对于2x2表,通常要求总样本量>40且所有期望频数>5。当期望频数过小时,可以考虑 费希尔精确检验 作为替代。 总结 :卡方检验通过比较观测频数与期望频数,构造一个服从卡方分布的统计量,从而对分类数据的分布拟合优度或变量间独立性进行统计推断。其核心步骤是:根据假设计算期望频数 -> 计算卡方统计量 -> 根据自由度和卡方分布判断显著性。使用时务必注意其适用条件,特别是期望频数的要求。