概率分布可分为离散型**和连续型两大类。以下是常见分布及其推导、实例(科普风格,推导过程简化):
一、离散型概率分布
1. 伯努利分布(Bernoulli Distribution)
- 定义:单次试验(如抛硬币)的结果,成功概率为 p ,失败为 1-p 。
- PMF:
- 期望与方差:
- 期望 E(X) = 1 * p + 0 *(1-p) = p
- 方差 Var(X)= E(X2) - [E(X)]2 = p - p2 = p(1-p)
- 例子:抛一枚公平硬币 p=0.5 ,正面朝上的期望为 0.5 ,方差为 0.25 。
2. 二项分布(Binomial Distribution)
- 定义: n 次独立伯努利试验中成功的次数。
- PMF:
推导:每次试验独立,成功 k 次的组合数为C(n,k)概率相乘。
- 期望与方差:
- 期望 E(X) = np (每次试验期望为 p ,共 n 次)
- 方差 Var(X) = np(1-p) (独立试验方差可加)
- 例子:抛硬币10次,出现3次正面的概率:
3. 泊松分布(Poisson Distribution)
- 定义:描述稀有事件在固定时间/空间内发生的次数(如每小时接到的电话数)。
- PMF:
推导:当 n →∞,p → 0 ,且 λ = np 时,二项分布趋近于泊松分布。
- 期望与方差: E(X) = Var(X) = λ
- 例子:某商店平均每小时有2位顾客,下一小时恰好来3人的概率:
二、连续型概率分布
1. 均匀分布(Uniform Distribution)
- 定义:在区间 [a, b]内概率密度恒定。
- PDF:
- 期望与方差:
- 期望 E(X) = (a+b)/2
- 方差 Var(X) = (b-a)2/12
- 例子:在区间 [0, 5]内随机选一个数,该数小于2的概率:
2. 正态分布(Normal Distribution)
- 定义:自然现象中常见的“钟形曲线”,参数为均值 μ和标准差 σ。
- PDF:
推导:通过中心极限定理,大量独立随机变量和的分布趋近于正态。
- 期望与方差:
- 期望 E(X) = μ
- 方差 Var(X) = σa2
- 例子:某考试平均分70分(σ=10 ),分数超过85分的概率:
3. 指数分布(Exponential Distribution)
- 定义:描述事件发生的等待时间(如灯泡寿命),具有无记忆性。
- PDF:
推导:泊松过程中,两次事件间隔时间服从指数分布。
- 期望与方差:
- 期望 E(X) = 1/λ
- 方差 Var(X) = 1/λ2
- 例子:某灯泡平均寿命5年(λ=0.2 ),用1年后不坏的概率:
三、其他常见分布(简表)
1. 几何分布(Geometric Distribution)
- 定义与由来:
在伯努利试验中,首次成功所需的试验次数。例如,抛硬币直到第一次出现正面。
核心思想:前 k-1 次失败,第 k 次成功。
- PMF公式推导:
每次试验独立,失败概率为 1-p ,成功概率为 p 。前 k-1 次全失败的概率为 (1-p)^(k-1) ,第 k 次成功。因此:
期望与方差:
- 期望 E(X) = 1/p
推导:等比级数求和
- 方差 Var(X) = 1-p/p2
- 计算案例:
假设某游戏抽卡的成功率为 p=0.1 ,求第3次才抽到SSR卡的概率:
2. 负二项分布(Negative Binomial Distribution)
- 定义与由来:
在伯努利试验中,获得第 r 次成功时所需的试验次数。例如,连续抛硬币直到第5次正面出现。
与二项分布的区别:二项分布固定试验次数 n,负二项分布固定成功次数 r 。
- PMF公式推导:
前 k-1 次试验中有 r-1 次成功,第 k 次必须成功。组合数为C(k-1,r-1),因此:
期望与方差:
- 期望 E(X) = r/p
- 方差 Var(X) = r(1-p)/p2
- 计算案例:
抛硬币直到第3次正面出现,求需要抛5次的概率( p=0.5 ):
3. 伽马分布(Gamma Distribution)
- 定义与由来:
描述多个独立指数事件(如设备故障)的总等待时间。
与指数分布的关系:当形状参数α = 1 时,伽马分布退化为指数分布。
- PDF公式推导:
若 α个独立指数变量(参数 λ)的和服从伽马分布,其PDF为:
其中
是伽马函数。
- 期望与方差:
- 期望 E(X) = α/λ
- 方差α/λ2
- 计算案例:
某设备平均每2个月故障一次(λ=0.5 ),求3次故障的总时间超过8个月的概率:
查伽马分布表或使用计算器可得结果约为 0.423 。
4. 卡方分布(Chi-Squared Distribution)
- 定义与由来:
k 个独立标准正态变量的平方和服从自由度为 k 的卡方分布。常用于假设检验(如方差分析)。
- PDF公式推导:
若 Z?, Z?, ..., Zk 是标准正态变量,则
的PDF为:
- 期望与方差:
- 期望 E(X) = k
- 方差 Var(X) = 2k
- 计算案例:
对某正态分布样本n=5 计算样本方差为4,假设总体方差为3,检验统计量:
自由度为4,查卡方表可得 P(X2 > 5.333) ≈0.25 ),无法拒绝原假设。
5. t分布(Student's t-Distribution)
- 定义与由来:
小样本(未知总体方差)时,用于估计正态分布均值的分布。由统计学家 William Gosset(笔名 Student)提出。
- PDF公式推导:
若 Z ~ N(0,1) ,U ~X2(k),则
服从自由度为 k 的t分布:
- 期望与方差:
- 期望 E(T) = 0 (当 k>1 )
- 方差Var(T)= k/(k-2)(当k>2 )
- 计算案例:
某饮料装瓶机声称平均装500ml,抽取9瓶测得均值498ml,样本标准差3ml。计算t统计量:
自由度为8,查t表得 P(T ≤ -2) ≈ 0.04 ,若显著性水平 α=0.05 ,拒绝原假设。
6. F分布(F-Distribution)
- 定义与由来:
用于比较两个正态分布总体的方差比。若
服从F分布。
- PDF公式推导:
其中
是贝塔函数。
- 期望与方差:
- 期望 E(F) = d?/(d?-2)(当 d? > 2 )
- 方差较复杂,与 d?和 d?均相关。
- 计算案例:
比较两种方法生产的产品方差,样本1方差 S?2=16 ( n?=10 ),样本2方差 S?2=9 (n?=8 )。计算F统计量:
自由度 d?=9 , d?=7 ,查F表得临界值约为3.68(α=0.05 ),未拒绝原假设。
总结
这些分布的应用场景和推导逻辑深刻体现了概率论与统计学的联系:
- 几何/负二项:从“等待成功”到“多次成功”的自然扩展。
- 伽马/卡方:通过正态分布的平方和或指数事件的叠加生成。
- t/F分布:为解决小样本推断和方差比较问题而诞生。
实际应用中,理解分布背后的场景(如样本量、参数意义)比记忆公式更重要。