引言
在概率论中,二项分布 (Binomial Distribution) 和 泊松分布 (Poisson Distribution) 是两个最重要的分布。乍看之下,它们似乎毫无关联:
- 二项分布 描述固定次数试验中的成功次数(例如抛硬币)。
- 泊松分布 描述在固定时间或空间内罕见事件的发生次数(例如每小时通过的车辆数)。
但令人惊奇的是,泊松分布其实是二项分布在特定条件下的极限形式! 让我们一起探索这个有趣的数学联系。
1. 二项分布
二项分布描述在 \( n \) 次独立试验中,恰好发生 \( k \) 次成功的概率,其中每次试验的成功概率为 \( p \)。
其概率质量函数 (PMF) 为:
\(
P(X = k) = {n \choose k} p^k (1-p)^{n-k}
\)
示例:
如果你抛一枚公平硬币 (\( p = 0.5 \)) 10 次 (\( n = 10 \)),恰好出现 3 次正面 (\( k = 3 \)) 的概率为:
\(
P(X = 3) = {10 \choose 3} (0.5)^3 (0.5)^7 \approx 0.117
\)
这在 \( n \) 较小且 \( p \) 不极小时非常适用。
2. 泊松分布
泊松分布描述在固定区间内,以平均速率 \( \lambda \) 发生的罕见事件的次数。
其概率质量函数 (PMF) 为:
\(
P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}
\)
示例:
如果某客服中心平均每小时接到 \( \lambda = 5 \) 通电话,那么下一小时恰好接到 2 通电话的概率为:
\(
P(X = 2) = \frac{5^2 e^{-5}}{2!} \approx 0.084
\)
这适用于事件罕见但可能多次独立发生的情况。
3. 联系之处:二项分布 → 泊松分布
现在,精彩的部分来了:泊松分布是二项分布在以下条件下的极限情况:
- \( n \to \infty \)(试验次数趋近无限大),
- \( p \to 0 \)(成功概率趋近于 0),
- 但 \( np = \lambda \)(保持固定的平均发生率)。
推导(简化版)
从二项分布的 PMF 出发:
\(
P(X = k) = {n \choose k} p^k (1-p)^{n-k}
\)
由于 \( p = \frac{\lambda}{n} \)(因为 \( np = \lambda \)),代入后得到:
\(
P(X = k) = {n \choose k} \left( \frac{\lambda}{n} \right)^k \left( 1 – \frac{\lambda}{n} \right)^{n-k}
\)
现在,考虑当 \( n \to \infty \) 时的极限:
- 第一步: 二项式系数 \( {n \choose k} \) 在 \( n \) 很大时近似于 \( \frac{n^k}{k!} \)。
- 第二步: \( \left( 1 – \frac{\lambda}{n} \right)^{n} \to e^{-\lambda} \)(这是指数函数的经典极限)。
- 第三步: \( \left( 1 – \frac{\lambda}{n} \right)^{-k} \to 1 \)(因为 \( k \) 是固定的)。
将所有部分结合起来:
\(
P(X = k) \approx \frac{n^k}{k!} \cdot \frac{\lambda^k}{n^k} \cdot e^{-\lambda} = \frac{\lambda^k e^{-\lambda}}{k!}
\)
这正是泊松分布的 PMF!
4. 何时适用此近似?
泊松近似在以下情况下效果良好:
- \( n \geq 20 \)(试验次数足够大),
- \( p \leq 0.05 \)(成功概率非常小),
- \( np \) 保持中等(例如 0.1 到 10 之间)。
示例:
某工厂生产 10,000 个灯泡,每个灯泡的缺陷率为 0.1% (\( p = 0.001 \))。
- 精确的二项分布概率(5 个缺陷品):
\(
{10000 \choose 5} (0.001)^5 (0.999)^{9995} \quad (\text{计算复杂!})
\) - 泊松近似(\( \lambda = np = 10 \)):
\(
\frac{10^5 e^{-10}}{5!} \approx 0.0378
\)
泊松近似不仅计算简单,而且与真实的二项分布概率非常接近!
5. 实际应用
这种联系不仅是理论上的,还广泛应用于:
- 电信(模拟电话呼叫次数),
- 生物学(预测 DNA 突变次数),
- 金融(估计罕见的股市崩盘),
- 医学(研究疾病暴发概率)。
只要遇到”大量试验 + 微小成功概率”的情况,泊松分布就能大幅简化计算!
结论
表面上看似完全不同的两个分布——二项分布(离散试验) 和 泊松分布(罕见事件)——实际上存在深刻的数学联系。泊松分布正是二项分布在”大量罕见事件”情况下的自然呈现。
这种优雅的关系展示了数学如何将看似不相关的概念统一成一个美妙的框架。下次遇到泊松分布时,请记住:它其实是二项分布的伪装!
Comments