U、N、P 都是“分布类型的简写”。
例如:
X ~ U(0,6)
读作:随机变量 X 服从区间 (0,6) 上的均匀分布。
其中符号 ~ 表示“服从……分布”。在考研数学一的概率论中,最常见的分布主要有以下几类。
一、最核心的六种常见分布
1. 0-1分布:B(1,p)
写作:
X ~ B(1,p)
或者直接写成:
P{X=1}=p,P{X=0}=1-p
参数 p 表示事件成功的概率,满足:
0 < p < 1
随机变量只能取两个值:
X = 0 或 1
其数字特征为:
E(X) = p
D(X) = p(1-p)
σ(X) = √[p(1-p)]
这里的 σ(X) 表示标准差。
0-1分布可以理解为只进行一次试验,例如:
- 产品合格记为1,不合格记为0;
- 投篮命中记为1,未命中记为0;
- 事件发生记为1,不发生记为0。
2. 二项分布:B(n,p)
写作:
X ~ B(n,p)
有时也写作:
X ~ Bin(n,p)
参数含义为:
n:独立重复试验的次数;p:每次试验成功的概率。
随机变量 X 表示 n 次试验中成功的次数,因此:
X = 0,1,2,…,n
概率质量函数为:
P{X=k} = Cₙᵏ pᵏ(1-p)ⁿ⁻ᵏ
数字特征为:
E(X) = np
D(X) = np(1-p)
σ(X) = √[np(1-p)]
二项分布和0-1分布的关系是:
B(1,p) 就是只进行一次试验的二项分布。
因此,0-1分布是二项分布的特殊情况。
3. 泊松分布:P(λ)
写作:
X ~ P(λ)
有些教材也会写成:
X ~ π(λ)
或者:
X ~ Poisson(λ)
参数 λ 表示单位时间、单位面积或单位范围内事件发生的平均次数,满足:
λ > 0
随机变量取值为:
X = 0,1,2,…
概率质量函数为:
P{X=k} = e⁻λ λᵏ/k!
泊松分布最重要的结论是:
E(X) = λ
D(X) = λ
σ(X) = √λ
也就是说,泊松分布的数学期望和方差相等,都等于参数 λ。
例如上一题中的:
X₃ ~ P(3)
表示 X₃ 服从参数为3的泊松分布,因此:
E(X₃)=3
D(X₃)=3
σ(X₃)=√3
看到泊松分布时,基本可以直接写出:
均值 = 方差 = λ
4. 均匀分布:U(a,b)
写作:
X ~ U(a,b)
其中:
a:区间左端点;b:区间右端点;- 必须满足
a < b。
表示随机变量 X 在区间 (a,b) 上均匀分布。
其概率密度为:
f(x) = 1/(b-a),a < x < b
0,其他
数字特征为:
E(X) = (a+b)/2
D(X) = (b-a)²/12
σ(X) = (b-a)/√12
由于 b>a,所以标准差也可以写成:
σ(X) = (b-a)/(2√3)
例如上一题:
X₁ ~ U(0,6)
其中:
a=0,b=6
因此:
E(X₁) = (0+6)/2 = 3
D(X₁) = (6-0)²/12 = 3
σ(X₁) = √3
均匀分布的期望就是区间中点,方差由区间长度决定。
快速记忆:
均值看中点,方差看长度平方除以12。
5. 指数分布:E(λ) 或 Exp(λ)
写作:
X ~ E(λ)
或者:
X ~ Exp(λ)
由于符号 E 也常用来表示数学期望,因此有些教材更喜欢使用 Exp(λ)。
参数 λ 称为率参数或强度参数,满足:
λ > 0
指数分布的概率密度为:
f(x) = λe⁻λx,x > 0
0,x ≤ 0
数字特征为:
E(X) = 1/λ
D(X) = 1/λ²
σ(X) = 1/λ
所以指数分布具有一个容易记忆的特点:
标准差 = 数学期望 = 1/λ
但方差是:
D(X)=1/λ²
不要把方差误写成 1/λ。
指数分布通常用于表示:
- 元件的寿命;
- 等待时间;
- 两次事件发生之间的时间间隔。
指数分布还具有无记忆性:
P{X>s+t | X>s} = P{X>t}
这是考研中较常考的性质。
6. 正态分布:N(μ,σ²)
写作:
X ~ N(μ,σ²)
参数含义为:
μ:数学期望,也就是均值;σ²:方差;σ:标准差。
因此:
E(X) = μ
D(X) = σ²
σ(X) = σ
这里必须特别注意:按照国内考研数学教材的通常约定,正态分布的第二个参数是方差,不是标准差。
例如:
X ~ N(0,4)
表示:
μ=0
σ²=4
所以:
E(X)=0
D(X)=4
σ(X)=2
不能认为标准差是4。
正态分布的概率密度为:
f(x) = 1/(√(2π)σ) · e⁻[(x-μ)²/(2σ²)]
当:
μ=0,σ²=1
称为标准正态分布,写作:
X ~ N(0,1)
标准正态分布一般用大写字母 Z 表示:
Z ~ N(0,1)
若:
X ~ N(μ,σ²)
则标准化以后:
Z = (X-μ)/σ ~ N(0,1)
二、六种核心分布总结表
| 分布 | 常用记号 | 参数含义 | 数学期望 E(X) | 方差 D(X) | 标准差 σ(X) |
|---|---|---|---|---|---|
| 0-1分布 | B(1,p) | p为成功概率 | p | p(1-p) | √[p(1-p)] |
| 二项分布 | B(n,p) | n为次数,p为成功概率 | np | np(1-p) | √[np(1-p)] |
| 泊松分布 | P(λ) | λ为平均发生次数 | λ | λ | √λ |
| 均匀分布 | U(a,b) | a、b为区间端点 | (a+b)/2 | (b-a)²/12 | (b-a)/√12 |
| 指数分布 | E(λ)、Exp(λ) | λ为率参数 | 1/λ | 1/λ² | 1/λ |
| 正态分布 | N(μ,σ²) | μ为均值,σ²为方差 | μ | σ² | σ |
这张表是考研概率论中必须熟练掌握的内容。
三、数学期望、方差、标准差之间的关系
1. 数学期望
数学期望反映随机变量取值的“平均位置”或“中心位置”。
记作:
E(X)
例如:
X ~ N(3,4)
表示它的均值在3附近,因此:
E(X)=3
但数学期望不一定是随机变量真正可以取到的值。
例如掷一次骰子,期望为:
E(X)=3.5
但骰子不可能掷出3.5。
2. 方差
方差反映随机变量相对于均值的波动程度。
定义为:
D(X) = E{[X-E(X)]²}
考研计算中更常使用:
D(X) = E(X²)-[E(X)]²
genui{“probability_statistics_learning_block”:{“type_id”:”VARIANCE”}}
这两个公式是等价的。
通常做题时:
- 已知分布,直接套分布的方差公式;
- 已知密度或分布律,需要计算
E(X)和E(X²); - 已知
E(X)和D(X),可以反推出E(X²)。
常用转换为:
E(X²) = D(X)+[E(X)]²
例如:
E(X)=2,D(X)=5
则:
E(X²)=5+2²=9
这里一定要注意:
D(X) 不等于 E(X²)。
3. 标准差
标准差就是方差的算术平方根:
σ(X) = √D(X)
方差的单位是原单位的平方,而标准差与随机变量本身单位相同。
例如某产品长度的单位是厘米:
- 数学期望的单位是厘米;
- 方差的单位是平方厘米;
- 标准差的单位是厘米。
因此标准差比方差更容易直接反映波动大小。
四、线性变换下的期望、方差和标准差
若:
Y = aX+b
则数学期望为:
E(Y) = aE(X)+b
方差为:
D(Y) = a²D(X)
标准差为:
σ(Y) = |a|σ(X)
这里有三个重要规律。
第一,常数 b 会改变均值,但不会改变方差。
例如:
Y=X+10
则:
E(Y)=E(X)+10
但是:
D(Y)=D(X)
因为整体平移不会改变数据的分散程度。
第二,方差中的系数必须平方。
例如:
Y=-2X
则:
D(Y)=(-2)²D(X)=4D(X)
而不是 -2D(X)。
第三,标准差中的系数要取绝对值。
σ(aX+b)=|a|σ(X)
标准差不可能是负数。
五、两个随机变量相加时的方差
一般情况下:
D(X+Y)=D(X)+D(Y)+2Cov(X,Y)
D(X-Y)=D(X)+D(Y)-2Cov(X,Y)
其中 Cov(X,Y) 是协方差。
若 X、Y 相互独立,则:
Cov(X,Y)=0
因此:
D(X+Y)=D(X)+D(Y)
D(X-Y)=D(X)+D(Y)
注意,即使是相减,方差仍然是相加,因为负号经过平方以后消失。
更一般地,如果 X₁、X₂、…、Xₙ 相互独立,则:
D(a₁X₁+a₂X₂+…+aₙXₙ)
=a₁²D(X₁)+a₂²D(X₂)+…+aₙ²D(Xₙ)
这就是第26题使用的公式。
六、第26题中三个记号的完整含义
题目给出:
X₁ ~ U(0,6)
说明:
X₁ 服从 (0,6) 上的均匀分布。
因此:
E(X₁)=3
D(X₁)=3
σ(X₁)=√3
题目给出:
X₂ ~ N(0,4)
说明:
X₂ 服从均值为0、方差为4的正态分布。
因此:
E(X₂)=0
D(X₂)=4
σ(X₂)=2
题目给出:
X₃ ~ P(3)
说明:
X₃ 服从参数为3的泊松分布。
因此:
E(X₃)=3
D(X₃)=3
σ(X₃)=√3
所以题目求:
D(X₁-2X₂+3X₃)
由于三者相互独立:
D(X₁-2X₂+3X₃)
=D(X₁)+(-2)²D(X₂)+3²D(X₃)
=3+4×4+9×3
=46
七、数理统计中还会出现的三个分布记号
除了前面的常见随机变量分布,在数理统计部分还会经常出现 χ²、t、F 三种抽样分布。
1. 卡方分布:χ²(n)
写作:
X ~ χ²(n)
其中 n 称为自由度。
若:
X₁,X₂,…,Xₙ 相互独立,且都服从 N(0,1)
则:
X₁²+X₂²+…+Xₙ² ~ χ²(n)
其数学期望和方差为:
E(X)=n
D(X)=2n
σ(X)=√(2n)
自由度具有可加性:
若 X ~ χ²(m),Y ~ χ²(n),且相互独立,则:
X+Y ~ χ²(m+n)
2. t分布:t(n)
写作:
T ~ t(n)
其中 n 为自由度。
若:
X ~ N(0,1)
Y ~ χ²(n)
且 X、Y 相互独立,则:
T = X/√(Y/n) ~ t(n)
当 n>1 时:
E(T)=0
当 n>2 时:
D(T)=n/(n-2)
考研中对 t 分布更重要的不是直接求它的方差,而是识别统计量:
(X̄-μ)/(S/√n) ~ t(n-1)
这里自由度是 n-1。
3. F分布:F(m,n)
写作:
F ~ F(m,n)
其中:
m:分子自由度;n:分母自由度。
若:
X ~ χ²(m)
Y ~ χ²(n)
并且二者相互独立,则:
(X/m)/(Y/n) ~ F(m,n)
F分布的一个重要性质是:
若:
F ~ F(m,n)
则:
1/F ~ F(n,m)
注意倒数以后,两个自由度的位置也要交换。
八、考研中最常见的符号陷阱
1. N(μ,σ²)的第二个参数是方差
例如:
X ~ N(2,9)
则:
E(X)=2
D(X)=9
σ(X)=3
不是标准差等于9。
2. P(λ)不是概率P
单独出现:
P(A)
表示事件 A 的概率。
而出现:
X ~ P(λ)
表示 X 服从泊松分布。
要结合上下文判断。
3. E既可以表示期望,也可以表示指数分布
E(X) 表示随机变量 X 的数学期望。
X ~ E(λ) 可能表示指数分布。
所以部分教材写为:
X ~ Exp(λ)
以避免混淆。
4. B(n,p)中的B可能表示二项分布
B(1,p) 是0-1分布。
B(n,p) 是二项分布。
部分教材也用 Bin(n,p),含义相同。
5. 方差、标准差不能混用
D(X)=σ²
σ(X)=√D(X)
例如:
D(X)=16
则标准差是:
σ(X)=4
不能说标准差也是16。
九、快速记忆
可以把六种核心分布压缩成下面几组关系。
二项分布:
E=np,D=np(1-p)
泊松分布:
E=D=λ
均匀分布:
E=(a+b)/2,D=(b-a)²/12
指数分布:
E=1/λ,D=1/λ²
正态分布:
E=μ,D=σ²
标准差统一为:
σ=√D
线性变换统一为:
E(aX+b)=aE(X)+b
D(aX+b)=a²D(X)
σ(aX+b)=|a|σ(X)
这部分在选择题、填空题以及数字特征计算题中出现频率很高,尤其要熟练识别 U、N、P、B、Exp、χ²、t、F 的参数含义。



