【什么是超几何分布】超几何分布是概率论中一种重要的离散概率分布,用于描述在不放回抽样中,成功事件发生的次数的概率分布。它与二项分布类似,但不同之处在于超几何分布适用于有限总体的抽样,且每次抽取后不放回,因此每次抽取的成功概率会随着样本的抽取而变化。
一、超几何分布的基本概念
概念 | 内容 |
定义 | 超几何分布描述的是在有限总体中进行不放回抽样时,某类元素被抽中的次数的概率分布。 |
适用场景 | 适用于从有限集合中随机抽取样本,且每次抽取后不放回的情况。例如:从一批产品中抽检次品数、从一副牌中抽到特定花色的牌数等。 |
与二项分布的区别 | 二项分布假设每次试验独立且成功概率不变,而超几何分布则考虑的是不放回抽样,每次抽取会影响后续的概率。 |
二、超几何分布的概率质量函数
设总体中有 $ N $ 个个体,其中有 $ K $ 个“成功”个体,从中抽取 $ n $ 个样本,其中恰好有 $ k $ 个“成功”个体的概率为:
$$
P(X = k) = \frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}}
$$
其中:
- $ \binom{a}{b} $ 表示组合数(从 $ a $ 个元素中选出 $ b $ 个的方式数)。
- $ X $ 是随机变量,表示在 $ n $ 次抽样中“成功”的次数。
三、超几何分布的期望和方差
统计量 | 公式 |
期望值 | $ E(X) = n \cdot \frac{K}{N} $ |
方差 | $ Var(X) = n \cdot \frac{K}{N} \cdot \left(1 - \frac{K}{N}\right) \cdot \frac{N - n}{N - 1} $ |
注意:方差中多了一个修正因子 $ \frac{N - n}{N - 1} $,这是由于不放回抽样的影响。
四、实际应用举例
场景 | 描述 |
抽检产品质量 | 从一批产品中抽检若干件,计算其中不合格品数量的概率。 |
选票统计 | 在不放回抽样中估算某一候选人获得选票的比例。 |
游戏中的概率计算 | 如扑克游戏中抽到特定牌的概率分析。 |
五、总结
超几何分布是一种在有限总体中进行不放回抽样时,用来计算成功事件出现次数的概率分布。它在实际生活中有广泛的应用,尤其在质量控制、统计抽样等领域具有重要意义。与二项分布相比,超几何分布更贴近现实情况,因为它考虑了抽样后的总体变化对后续概率的影响。
如需进一步了解其与其他分布的关系(如二项分布、泊松分布),可继续深入探讨。