优秀的编程知识分享平台

网站首页 > 技术文章 正文

概率分布的类型及详解

nanyue 2025-02-07 18:37:56 技术文章 4 ℃

概率分布可分为离散型**和连续型两大类。以下是常见分布及其推导、实例(科普风格,推导过程简化):

一、离散型概率分布

1. 伯努利分布(Bernoulli Distribution)

- 定义:单次试验(如抛硬币)的结果,成功概率为 p ,失败为 1-p 。

- PMF:

- 期望与方差:

- 期望 E(X) = 1 * p + 0 *(1-p) = p

- 方差 Var(X)= E(X2) - [E(X)]2 = p - p2 = p(1-p)

- 例子:抛一枚公平硬币 p=0.5 ,正面朝上的期望为 0.5 ,方差为 0.25 。

2. 二项分布(Binomial Distribution)

- 定义: n 次独立伯努利试验中成功的次数。

- PMF:

推导:每次试验独立,成功 k 次的组合数为C(n,k)概率相乘。

- 期望与方差:

- 期望 E(X) = np (每次试验期望为 p ,共 n 次)

- 方差 Var(X) = np(1-p) (独立试验方差可加)

- 例子:抛硬币10次,出现3次正面的概率:

3. 泊松分布(Poisson Distribution)

- 定义:描述稀有事件在固定时间/空间内发生的次数(如每小时接到的电话数)。

- PMF:

推导:当 n →∞,p → 0 ,且 λ = np 时,二项分布趋近于泊松分布。

- 期望与方差: E(X) = Var(X) = λ

- 例子:某商店平均每小时有2位顾客,下一小时恰好来3人的概率:

二、连续型概率分布

1. 均匀分布(Uniform Distribution)

- 定义:在区间 [a, b]内概率密度恒定。

- PDF:

- 期望与方差:

- 期望 E(X) = (a+b)/2

- 方差 Var(X) = (b-a)2/12

- 例子:在区间 [0, 5]内随机选一个数,该数小于2的概率:

2. 正态分布(Normal Distribution)

- 定义:自然现象中常见的“钟形曲线”,参数为均值 μ和标准差 σ。

- PDF:

推导:通过中心极限定理,大量独立随机变量和的分布趋近于正态。

- 期望与方差:

- 期望 E(X) = μ

- 方差 Var(X) = σa2

- 例子:某考试平均分70分(σ=10 ),分数超过85分的概率:

3. 指数分布(Exponential Distribution)

- 定义:描述事件发生的等待时间(如灯泡寿命),具有无记忆性。

- PDF:

推导:泊松过程中,两次事件间隔时间服从指数分布。

- 期望与方差:

- 期望 E(X) = 1/λ

- 方差 Var(X) = 1/λ2

- 例子:某灯泡平均寿命5年(λ=0.2 ),用1年后不坏的概率:

三、其他常见分布(简表)

1. 几何分布(Geometric Distribution)

- 定义与由来:

在伯努利试验中,首次成功所需的试验次数。例如,抛硬币直到第一次出现正面。

核心思想:前 k-1 次失败,第 k 次成功。

- PMF公式推导:

每次试验独立,失败概率为 1-p ,成功概率为 p 。前 k-1 次全失败的概率为 (1-p)^(k-1) ,第 k 次成功。因此:

期望与方差:

- 期望 E(X) = 1/p

推导:等比级数求和

- 方差 Var(X) = 1-p/p2

- 计算案例:

假设某游戏抽卡的成功率为 p=0.1 ,求第3次才抽到SSR卡的概率:

2. 负二项分布(Negative Binomial Distribution)

- 定义与由来:

在伯努利试验中,获得第 r 次成功时所需的试验次数。例如,连续抛硬币直到第5次正面出现。

与二项分布的区别:二项分布固定试验次数 n,负二项分布固定成功次数 r 。

- PMF公式推导:

前 k-1 次试验中有 r-1 次成功,第 k 次必须成功。组合数为C(k-1,r-1),因此:

期望与方差:

- 期望 E(X) = r/p

- 方差 Var(X) = r(1-p)/p2

- 计算案例:

抛硬币直到第3次正面出现,求需要抛5次的概率( p=0.5 ):

3. 伽马分布(Gamma Distribution)

- 定义与由来:

描述多个独立指数事件(如设备故障)的总等待时间。

与指数分布的关系:当形状参数α = 1 时,伽马分布退化为指数分布。

- PDF公式推导:

若 α个独立指数变量(参数 λ)的和服从伽马分布,其PDF为:

其中

是伽马函数。

- 期望与方差:

- 期望 E(X) = α/λ

- 方差α/λ2

- 计算案例:

某设备平均每2个月故障一次(λ=0.5 ),求3次故障的总时间超过8个月的概率:

查伽马分布表或使用计算器可得结果约为 0.423 。

4. 卡方分布(Chi-Squared Distribution)

- 定义与由来:

k 个独立标准正态变量的平方和服从自由度为 k 的卡方分布。常用于假设检验(如方差分析)。

- PDF公式推导:

若 Z?, Z?, ..., Zk 是标准正态变量,则

的PDF为:

- 期望与方差:

- 期望 E(X) = k

- 方差 Var(X) = 2k

- 计算案例:

对某正态分布样本n=5 计算样本方差为4,假设总体方差为3,检验统计量:

自由度为4,查卡方表可得 P(X2 > 5.333) ≈0.25 ),无法拒绝原假设。

5. t分布(Student's t-Distribution)

- 定义与由来:

小样本(未知总体方差)时,用于估计正态分布均值的分布。由统计学家 William Gosset(笔名 Student)提出。

- PDF公式推导:

若 Z ~ N(0,1) ,U ~X2(k),则

服从自由度为 k 的t分布:

- 期望与方差:

- 期望 E(T) = 0 (当 k>1 )

- 方差Var(T)= k/(k-2)(当k>2 )

- 计算案例:

某饮料装瓶机声称平均装500ml,抽取9瓶测得均值498ml,样本标准差3ml。计算t统计量:

自由度为8,查t表得 P(T ≤ -2) ≈ 0.04 ,若显著性水平 α=0.05 ,拒绝原假设。

6. F分布(F-Distribution)

- 定义与由来:

用于比较两个正态分布总体的方差比。若

服从F分布。

- PDF公式推导:

其中

是贝塔函数。

- 期望与方差:

- 期望 E(F) = d?/(d?-2)(当 d? > 2 )

- 方差较复杂,与 d?和 d?均相关。

- 计算案例:

比较两种方法生产的产品方差,样本1方差 S?2=16 ( n?=10 ),样本2方差 S?2=9 (n?=8 )。计算F统计量:

自由度 d?=9 , d?=7 ,查F表得临界值约为3.68(α=0.05 ),未拒绝原假设。

总结

这些分布的应用场景和推导逻辑深刻体现了概率论与统计学的联系:

- 几何/负二项:从“等待成功”到“多次成功”的自然扩展。

- 伽马/卡方:通过正态分布的平方和或指数事件的叠加生成。

- t/F分布:为解决小样本推断和方差比较问题而诞生。

实际应用中,理解分布背后的场景(如样本量、参数意义)比记忆公式更重要。

最近发表
标签列表