引言
在機率論中,二項分佈 (Binomial Distribution) 和 泊松分佈 (Poisson Distribution) 是兩個最重要的分佈。乍看之下,它們似乎毫無關聯:
- 二項分佈 描述固定次數試驗中的成功次數(例如擲硬幣)。
- 泊松分佈 描述在固定時間或空間內罕見事件的發生次數(例如每小時通過的車輛數)。
但令人驚奇的是,泊松分佈其實是二項分佈在特定條件下的極限形式! 讓我們一起探索這個有趣的數學關聯。
1. 二項分佈
二項分佈描述在 \( n \) 次獨立試驗中,恰好發生 \( k \) 次成功的機率,其中每次試驗的成功機率為 \( p \)。
其機率質量函數 (PMF) 為:
\(
P(X = k) = {n \choose k} p^k (1-p)^{n-k}
\)
範例:
如果你擲一枚公平硬幣 (\( p = 0.5 \)) 10 次 (\( n = 10 \)),恰好出現 3 次正面 (\( k = 3 \)) 的機率為:
\(
P(X = 3) = {10 \choose 3} (0.5)^3 (0.5)^7 \approx 0.117
\)
這在 \( n \) 較小且 \( p \) 不極小時非常適用。
2. 泊松分佈
泊松分佈描述在固定區間內,以平均速率 \( \lambda \) 發生的罕見事件的次數。
其機率質量函數 (PMF) 為:
\(
P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}
\)
範例:
如果某客服中心平均每小時接到 \( \lambda = 5 \) 通電話,那麼下一小時恰好接到 2 通電話的機率為:
\(
P(X = 2) = \frac{5^2 e^{-5}}{2!} \approx 0.084
\)
這適用於事件罕見但可能多次獨立發生的情況。
3. 關聯之處:二項分佈 → 泊松分佈
現在,精彩的部分來了:泊松分佈是二項分佈在以下條件下的極限情況:
- \( n \to \infty \)(試驗次數趨近無限大),
- \( p \to 0 \)(成功機率趨近於 0),
- 但 \( np = \lambda \)(保持固定的平均發生率)。
推導(簡化版)
從二項分佈的 PMF 出發:
\(
P(X = k) = {n \choose k} p^k (1-p)^{n-k}
\)
由於 \( p = \frac{\lambda}{n} \)(因為 \( np = \lambda \)),代入後得到:
\(
P(X = k) = {n \choose k} \left( \frac{\lambda}{n} \right)^k \left( 1 – \frac{\lambda}{n} \right)^{n-k}
\)
現在,考慮當 \( n \to \infty \) 時的極限:
- 第一步: 二項式係數 \( {n \choose k} \) 在 \( n \) 很大時近似於 \( \frac{n^k}{k!} \)。
- 第二步: \( \left( 1 – \frac{\lambda}{n} \right)^{n} \to e^{-\lambda} \)(這是指數函數的經典極限)。
- 第三步: \( \left( 1 – \frac{\lambda}{n} \right)^{-k} \to 1 \)(因為 \( k \) 是固定的)。
將所有部分結合起來:
\(
P(X = k) \approx \frac{n^k}{k!} \cdot \frac{\lambda^k}{n^k} \cdot e^{-\lambda} = \frac{\lambda^k e^{-\lambda}}{k!}
\)
這正是泊松分佈的 PMF!
4. 何時適用此近似?
泊松近似在以下情況下效果良好:
- \( n \geq 20 \)(試驗次數足夠大),
- \( p \leq 0.05 \)(成功機率非常小),
- \( np \) 保持中等(例如 0.1 到 10 之間)。
範例:
某工廠生產 10,000 個燈泡,每個燈泡的缺陷率為 0.1% (\( p = 0.001 \))。
- 精確的二項分佈機率(5 個缺陷品):
\(
{10000 \choose 5} (0.001)^5 (0.999)^{9995} \quad (\text{計算複雜!})
\) - 泊松近似(\( \lambda = np = 10 \)):
\(
\frac{10^5 e^{-10}}{5!} \approx 0.0378
\)
泊松近似不僅計算簡單,而且與真實的二項分佈機率非常接近!
5. 實際應用
這種關聯不僅是理論上的,還廣泛應用於:
- 電信(模擬電話呼叫次數),
- 生物學(預測 DNA 突變次數),
- 金融(估計罕見的股市崩盤),
- 醫學(研究疾病爆發機率)。
只要遇到「大量試驗 + 微小成功機率」的情況,泊松分佈就能大幅簡化計算!
結論
表面上看似完全不同的兩個分佈——二項分佈(離散試驗) 和 泊松分佈(罕見事件)——實際上存在深刻的數學關聯。泊松分佈正是二項分佈在「大量罕見事件」情況下的自然呈現。
這種優雅的關係展示了數學如何將看似不相關的概念統一成一個美妙的框架。下次遇到泊松分佈時,請記住:它其實是二項分佈的偽裝!
Comments