概率分布的类型及详解

概率分布可分为离散型**和连续型两大类。以下是常见分布及其推导、实例（科普风格，推导过程简化）：

一、离散型概率分布

1. 伯努利分布（Bernoulli Distribution）

- 定义：单次试验（如抛硬币）的结果，成功概率为 p ，失败为 1-p 。

- PMF：

- 期望与方差：

- 期望 E(X) = 1 * p + 0 *(1-p) = p

- 方差 Var(X)= E(X2) - [E(X)]2 = p - p2 = p(1-p)

- 例子：抛一枚公平硬币 p=0.5 ，正面朝上的期望为 0.5 ，方差为 0.25 。

2. 二项分布（Binomial Distribution）

- 定义： n 次独立伯努利试验中成功的次数。

- PMF：

推导：每次试验独立，成功 k 次的组合数为C(n,k)概率相乘。

- 期望与方差：

- 期望 E(X) = np （每次试验期望为 p ，共 n 次）

- 方差 Var(X) = np(1-p) （独立试验方差可加）

- 例子：抛硬币10次，出现3次正面的概率：

3. 泊松分布（Poisson Distribution）

- 定义：描述稀有事件在固定时间/空间内发生的次数（如每小时接到的电话数）。

- PMF：

推导：当 n →∞，p → 0 ，且 λ = np 时，二项分布趋近于泊松分布。

- 期望与方差： E(X) = Var(X) = λ

- 例子：某商店平均每小时有2位顾客，下一小时恰好来3人的概率：

二、连续型概率分布

1. 均匀分布（Uniform Distribution）

- 定义：在区间 [a, b]内概率密度恒定。

- PDF：

- 期望与方差：

- 期望 E(X) = (a+b)/2

- 方差 Var(X) = (b-a)2/12

- 例子：在区间 [0, 5]内随机选一个数，该数小于2的概率：

2. 正态分布（Normal Distribution）

- 定义：自然现象中常见的“钟形曲线”，参数为均值 μ和标准差 σ。

- PDF：

推导：通过中心极限定理，大量独立随机变量和的分布趋近于正态。

- 期望与方差：

- 期望 E(X) = μ

- 方差 Var(X) = σa2

- 例子：某考试平均分70分（σ=10 )，分数超过85分的概率：

3. 指数分布（Exponential Distribution）

- 定义：描述事件发生的等待时间（如灯泡寿命），具有无记忆性。

- PDF：

推导：泊松过程中，两次事件间隔时间服从指数分布。

- 期望与方差：

- 期望 E(X) = 1/λ

- 方差 Var(X) = 1/λ2

- 例子：某灯泡平均寿命5年（λ=0.2 )，用1年后不坏的概率：

三、其他常见分布（简表）

1. 几何分布（Geometric Distribution）

- 定义与由来：

在伯努利试验中，首次成功所需的试验次数。例如，抛硬币直到第一次出现正面。

核心思想：前 k-1 次失败，第 k 次成功。

- PMF公式推导：

每次试验独立，失败概率为 1-p ，成功概率为 p 。前 k-1 次全失败的概率为 (1-p)^(k-1) ，第 k 次成功。因此：

期望与方差：

- 期望 E(X) = 1/p

推导：等比级数求和

- 方差 Var(X) = 1-p/p2

- 计算案例：

假设某游戏抽卡的成功率为 p=0.1 ，求第3次才抽到SSR卡的概率：

2. 负二项分布（Negative Binomial Distribution）

- 定义与由来：

在伯努利试验中，获得第 r 次成功时所需的试验次数。例如，连续抛硬币直到第5次正面出现。

与二项分布的区别：二项分布固定试验次数 n，负二项分布固定成功次数 r 。

- PMF公式推导：

前 k-1 次试验中有 r-1 次成功，第 k 次必须成功。组合数为C(k-1，r-1),因此：

期望与方差：

- 期望 E(X) = r/p

- 方差 Var(X) = r(1-p)/p2

- 计算案例：

抛硬币直到第3次正面出现，求需要抛5次的概率( p=0.5 )：

3. 伽马分布（Gamma Distribution）

- 定义与由来：

描述多个独立指数事件（如设备故障）的总等待时间。

与指数分布的关系：当形状参数α = 1 时，伽马分布退化为指数分布。

- PDF公式推导：

若 α个独立指数变量（参数 λ）的和服从伽马分布，其PDF为：

其中

是伽马函数。

- 期望与方差：

- 期望 E(X) = α/λ

- 方差α/λ2

- 计算案例：

某设备平均每2个月故障一次（λ=0.5 ），求3次故障的总时间超过8个月的概率：

查伽马分布表或使用计算器可得结果约为 0.423 。

4. 卡方分布（Chi-Squared Distribution）

- 定义与由来：

k 个独立标准正态变量的平方和服从自由度为 k 的卡方分布。常用于假设检验（如方差分析）。

- PDF公式推导：

若 Z?, Z?, ..., Zk 是标准正态变量，则

的PDF为：

- 期望与方差：

- 期望 E(X) = k

- 方差 Var(X) = 2k

- 计算案例：

对某正态分布样本n=5 计算样本方差为4，假设总体方差为3，检验统计量：

自由度为4，查卡方表可得 P(X2 > 5.333) ≈0.25 )，无法拒绝原假设。

5. t分布（Student's t-Distribution）

- 定义与由来：

小样本（未知总体方差）时，用于估计正态分布均值的分布。由统计学家 William Gosset（笔名 Student）提出。

- PDF公式推导：

若 Z ~ N(0,1) ，U ~X2(k)，则

服从自由度为 k 的t分布：

- 期望与方差：

- 期望 E(T) = 0 （当 k>1 ）

- 方差Var(T)= k/(k-2)（当k>2 ）

- 计算案例：

某饮料装瓶机声称平均装500ml，抽取9瓶测得均值498ml，样本标准差3ml。计算t统计量：

自由度为8，查t表得 P(T ≤ -2) ≈ 0.04 ，若显著性水平 α=0.05 ，拒绝原假设。

6. F分布（F-Distribution）

- 定义与由来：

用于比较两个正态分布总体的方差比。若

服从F分布。

- PDF公式推导：

其中

是贝塔函数。

- 期望与方差：

- 期望 E(F) = d?/(d?-2)（当 d? > 2 ）

- 方差较复杂，与 d?和 d?均相关。

- 计算案例：

比较两种方法生产的产品方差，样本1方差 S?2=16 ( n?=10 )，样本2方差 S?2=9 （n?=8 ）。计算F统计量：

自由度 d?=9 , d?=7 ，查F表得临界值约为3.68（α=0.05 ），未拒绝原假设。

总结

这些分布的应用场景和推导逻辑深刻体现了概率论与统计学的联系：

- 几何/负二项：从“等待成功”到“多次成功”的自然扩展。

- 伽马/卡方：通过正态分布的平方和或指数事件的叠加生成。

- t/F分布：为解决小样本推断和方差比较问题而诞生。

实际应用中，理解分布背后的场景（如样本量、参数意义）比记忆公式更重要。

网站首页 > 技术文章正文

猜你喜欢

网站首页 > 技术文章 正文

概率分布的类型及详解

猜你喜欢

网站首页 > 技术文章正文