雅可比因子
本文最后更新于10 天前,其中的信息可能已经过时,如有错误请发送邮件到184874483@qq.com

本题答案为:

f_Z(z) = 2(1 - z),    0 < z < 1
f_Z(z) = 0,           其他

这里的关键不是把 XY 当成独立变量,而是直接使用二维连续型随机变量的变量变换公式。


一、题目条件与变量范围

题目给出 (X,Y) 的联合密度:

f(x,y) = x + y,    0 < x < 1, 0 < y < 1
       = 0,        其他

要求:

Z = XY

因为 0 < X < 10 < Y < 1,所以:

0 < Z = XY < 1

因此最后的密度只可能在 0 < z < 1 上非零。


二、使用乘积型随机变量公式

图 2 中的公式本质上是:

若 Z = XY,且 (X,Y) 的联合密度为 φ(x,y),则

f_Z(z) = ∫ 1/|x| · φ(x, z/x) dx

这里不是要求 X,Y 独立。只要知道联合密度 φ(x,y),就可以用这个公式。

本题中:

φ(x,y) = x + y

所以:

φ(x, z/x) = x + z/x

于是:

f_Z(z) = ∫ 1/|x| · (x + z/x) dx

但积分范围不能直接写成 -∞+∞ 后就不管了。必须结合原来的区域:

0 < x < 1
0 < y < 1
y = z/x

因为 0 < z < 1,且 x > 0,所以:

0 < z/x < 1

这等价于:

x > z

同时又有:

x < 1

因此积分范围是:

z < x < 1

所以:

f_Z(z) = ∫[z 到 1] 1/x · (x + z/x) dx

化简:

1/x · (x + z/x)
= 1 + z/x²

于是:

f_Z(z)
= ∫[z 到 1] (1 + z/x²) dx
= ∫[z 到 1] 1 dx + ∫[z 到 1] z/x² dx

分别计算:

∫[z 到 1] 1 dx = 1 - z

以及:

∫[z 到 1] z/x² dx
= z∫[z 到 1] x⁻² dx
= z[-1/x][z 到 1]
= z(-1 + 1/z)
= 1 - z

所以:

f_Z(z) = (1 - z) + (1 - z) = 2(1 - z)

最终:

f_Z(z) = 2(1 - z),    0 < z < 1
f_Z(z) = 0,           其他

三、图 2 公式的转化原理

图 2 的公式来自二维变量变换。

要求 Z = XY 的密度,通常补充一个辅助变量,例如令:

U = X
Z = XY

那么:

x = u
z = xy

z = xy 得:

y = z/u

所以反变换为:

x = u
y = z/u

接下来要算雅可比因子:

∂(x,y)/∂(u,z)

也就是:

x = u
y = z/u

u,z 求偏导:

∂x/∂u = 1
∂x/∂z = 0

∂y/∂u = -z/u²
∂y/∂z = 1/u

所以行列式为:

| 1        0   |
| -z/u²   1/u |

= 1/u

取绝对值:

|∂(x,y)/∂(u,z)| = 1/|u|

因为这里 u=x,所以就是:

1/|x|

于是联合密度变为:

f_{U,Z}(u,z)
= φ(u, z/u) · 1/|u|

再把辅助变量 U 积掉,就得到 Z 的边缘密度:

f_Z(z) = ∫ φ(u, z/u) · 1/|u| du

u 改写成 x,就是图 2 的公式:

f_Z(z) = ∫ 1/|x| · φ(x, z/x) dx

所以这个公式的本质是:

先做二维变量变换,再对辅助变量积分消去。

四、这个公式有哪些常见变式?

这类题的核心套路是:要求一个新变量 Z = h(X,Y) 的密度,就补一个变量,把二维变换凑成一一对应,然后用雅可比因子。

1. 和:Z = X + Y

令:

U = X
Z = X + Y

则:

Y = Z - X

所以:

f_Z(z) = ∫ φ(x, z - x) dx

这里雅可比因子是 1


2. 差:Z = X – Y

令:

U = X
Z = X - Y

则:

Y = X - Z

所以:

f_Z(z) = ∫ φ(x, x - z) dx

也可以令 U = Y,则:

X = Z + Y

于是:

f_Z(z) = ∫ φ(z + y, y) dy

这两个写法本质一样,只是选的辅助变量不同。


3. 积:Z = XY

这就是图 2 的公式:

f_Z(z) = ∫ 1/|x| · φ(x, z/x) dx

如果 X,Y 独立,联合密度可以写成:

φ(x,y) = f_X(x)f_Y(y)

于是才有:

f_Z(z) = ∫ 1/|x| · f_X(x) · f_Y(z/x) dx

但注意,本题没有用独立性,因为题目已经给了联合密度 φ(x,y)=x+y


4. 商:Z = Y/X

令:

U = X
Z = Y/X

则:

Y = XZ

所以:

f_Z(z) = ∫ |x| · φ(x, xz) dx

这里的雅可比因子变成了 |x|,不是 1/|x|

原因是:

积:y = z/x,所以 dy/dz = 1/x
商:y = xz,所以 dy/dz = x

所以积和商的系数正好不同。


五、为什么本题不能直接套独立变量乘积公式?

本题的联合密度是:

f(x,y) = x + y

如果 X,Y 独立,应当有:

f(x,y) = f_X(x)f_Y(y)

但本题中:

f_X(x) = ∫[0 到 1] (x+y) dy = x + 1/2
f_Y(y) = ∫[0 到 1] (x+y) dx = y + 1/2

如果独立,则应有:

f_X(x)f_Y(y) = (x + 1/2)(y + 1/2)

这显然不等于:

x + y

所以 X,Y 不独立。

但是不独立完全不影响本题计算,因为图 2 公式本来就是用联合密度 φ(x,y) 来算的,不是独立公式。


六、这类题的快速识别方法

看到题目给出 (X,Y) 的联合密度,又要求 Z = XYZ = X/YZ = X+YZ = X-Y 这类变量函数的密度时,优先想到:

二维变量变换 + 雅可比因子 + 积掉辅助变量

具体到乘积型:

Z = XY

直接记:

f_Z(z) = ∫ 1/|x| · f(x, z/x) dx

然后最重要的一步是找积分范围:

原区域条件 + y = z/x

本题就是:

0 < x < 1
0 < z/x < 1

推出:

z < x < 1

这一步是这类题最容易错的地方。公式本身不难,难点通常在于把原来的二维区域正确投影到辅助变量的积分区间上。

这个雅克比因子,这一串是指按照这种式子∂(x,y)/∂(u,z)来推导的话,是不是只要行替换之后,他这个求因子的结果就会作为替换过后公式的系数对吧?

对,可以这样理解:∂(x,y)/∂(u,z) 这种反变换雅可比来推导时,算出来的雅可比行列式绝对值,就会作为变量替换后密度函数前面的“系数因子”。

但要注意三个限制:

1. 必须取绝对值;
2. 必须用“旧变量对新变量”的雅可比:∂(x,y)/∂(u,z);
3. 还要重新确定新变量的取值范围,不能只换公式不换范围。

更准确地说,原来有联合密度:

f_{X,Y}(x,y)

现在做变量变换:

u = u(x,y)
z = z(x,y)

如果能反解出:

x = x(u,z)
y = y(u,z)

那么新变量 (U,Z) 的联合密度是:

f_{U,Z}(u,z)
= f_{X,Y}(x(u,z), y(u,z)) · |∂(x,y)/∂(u,z)|

所以你说的“替换过后公式的系数”基本就是这个意思。


以第 59 题为例,要算:

Z = XY

补一个辅助变量:

U = X
Z = XY

于是反解:

X = U
Y = Z/U

也就是:

x = u
y = z/u

接下来算雅可比因子:

∂(x,y)/∂(u,z)

对应矩阵是:

| ∂x/∂u    ∂x/∂z |
| ∂y/∂u    ∂y/∂z |

因为:

x = u
y = z/u

所以:

∂x/∂u = 1
∂x/∂z = 0

∂y/∂u = -z/u²
∂y/∂z = 1/u

因此:

∂(x,y)/∂(u,z)
=
| 1        0   |
| -z/u²   1/u |
= 1/u

取绝对值:

|∂(x,y)/∂(u,z)| = 1/|u|

因为这里 u = x,所以也可以写成:

1/|x|

于是:

f_{U,Z}(u,z)
= f_{X,Y}(u, z/u) · 1/|u|

然后再把辅助变量 u 积掉:

f_Z(z) = ∫ f_{X,Y}(u, z/u) · 1/|u| du

u 换名叫 x,就得到图 2 的形式:

f_Z(z) = ∫ f_{X,Y}(x, z/x) · 1/|x| dx

这里的本质可以用一句话概括:

概率不变,但坐标面积被拉伸或压缩了,所以密度要乘上面积缩放因子。

原来的概率小块大约是:

P ≈ f_{X,Y}(x,y) dxdy

变量换成 (u,z) 后,同一个小块面积满足:

dxdy = |∂(x,y)/∂(u,z)| dudz

所以:

P ≈ f_{X,Y}(x(u,z), y(u,z)) · |∂(x,y)/∂(u,z)| dudz

因此新密度就是:

原密度代入反变换 × 雅可比因子绝对值

这就是它为什么会变成“系数”的原因。


但是要特别注意:不能随便算 ∂(u,z)/∂(x,y) 然后直接乘。

如果算的是:

∂(u,z)/∂(x,y)

那这是“新变量对旧变量”的雅可比。密度变换中通常要用的是它的倒数:

|∂(x,y)/∂(u,z)| = 1 / |∂(u,z)/∂(x,y)|

当然前提是变换局部一一对应。

比如本题:

u = x
z = xy

算:

∂(u,z)/∂(x,y)

矩阵为:

| ∂u/∂x    ∂u/∂y |
| ∂z/∂x    ∂z/∂y |
=
| 1    0 |
| y    x |

行列式是:

x

所以反过来:

|∂(x,y)/∂(u,z)| = 1/|x|

这和前面算出的 1/|u| 是一致的,因为 u=x


所以考研里可以这样记:

如果用反解后的旧变量 x=x(u,z), y=y(u,z) 来算雅可比,
那么算出来的 |∂(x,y)/∂(u,z)| 直接乘到原联合密度后面。

如果用原变换 u=u(x,y), z=z(x,y) 来算雅可比,
那么要取倒数再乘。

第 59 题中就是:

旧密度:f(x,y) = x + y

反变换:
x = u
y = z/u

代入旧密度:
f(u, z/u) = u + z/u

乘雅可比因子:
f_{U,Z}(u,z) = (u + z/u) · 1/|u|

然后再根据原区域确定 u 的积分范围。因为原来:

0 < x < 1
0 < y < 1

代入:

x = u
y = z/u

得到:

0 < u < 1
0 < z/u < 1

0 < z < 1 时,有:

z < u < 1

所以:

f_Z(z)
= ∫[z 到 1] (u + z/u) · 1/u du
= ∫[z 到 1] (1 + z/u²) du
= 2(1 - z)

最后再强调一句:雅可比因子确实会作为替换后的系数,但它不是“凭空多出来的系数”,而是二维面积元从 dxdy 变成 dudz 时的面积缩放比例。

这类题最常见的错误不是雅可比算错,而是只记得乘 1/|x|,却忘了重新根据原区域确定积分上下限。第 59 题真正的关键就是从:

0 < x < 1, 0 < y < 1, y = z/x

推出:

z < x < 1

这个范围一旦确定,后面就是机械积分。

对,这道题的核心理解基本正确,但要稍微修正一下说法:

这里不是“求 f(x,y) 不能直接用密度函数”,而是说:要求系统寿命 Z = min(X,Y) 或 Z = max(X,Y) 的密度时,不能把 X、Y 的密度函数简单代入 min 或 max 得到 Z 的密度。

因为 Z = min(X,Y) 不是一一变换。很多不同的 (x,y) 都可能对应同一个 z,比如:

min(2,5)=2

min(2,100)=2

min(2,2.3)=2

所以不能像二维变量变换那样,直接用雅可比行列式写出密度。考研数学里遇到这种“由随机变量构造新随机变量”的题,尤其是 min(X,Y)max(X,Y),最稳的方法就是先求分布函数,再求导得到密度函数。


本题中,X 和 Y 分别表示两个独立子系统 L₁、L₂ 的寿命,且

f_X(x) = αe^(-αx), x > 0

f_Y(y) = βe^(-βy), y > 0

它们都是指数分布。先由密度函数得到分布函数:

F_X(x) = P(X ≤ x) = 1 - e^(-αx), x > 0

F_Y(y) = P(Y ≤ y) = 1 - e^(-βy), y > 0

同时还要记住生存函数:

P(X > x) = e^(-αx)

P(Y > y) = e^(-βy)


对于串联系统,只要其中一个坏了,整个系统就停止工作,所以系统寿命为

Z = min(X,Y)

要求 Z 的分布函数:

F_Z(z) = P(Z ≤ z)

也就是:

F_Z(z) = P(min(X,Y) ≤ z)

这个事件不太好直接算,因为它表示“X ≤ z 或 Y ≤ z”,涉及并事件。考研中通常转化为对立事件:

min(X,Y) > z

等价于:

X > z 且 Y > z

所以:

P(min(X,Y) > z) = P(X > z, Y > z)

由于 X 和 Y 独立:

P(X > z, Y > z) = P(X > z)P(Y > z)

于是:

P(Z > z) = e^(-αz)e^(-βz) = e^(-(α+β)z)

所以:

F_Z(z) = 1 - P(Z > z)

即:

F_Z(z) = 1 - e^(-(α+β)z), z > 0

再对 z 求导,得到密度函数:

f_Z(z) = (α + β)e^(-(α+β)z), z > 0

这说明串联系统的寿命仍然服从指数分布,参数为 α + β


这里容易误解的是“独立之后是不是可以直接乘密度”。

独立只能说明联合密度可以写成:

f_XY(x,y) = f_X(x)f_Y(y) = αβe^(-αx-βy)

但这只是 (X,Y) 这个二维随机变量的联合密度,不是 Z = min(X,Y) 的密度。

如果要通过联合密度求 Z 的分布,也可以,但仍然要对区域积分:

F_Z(z) = P(min(X,Y) ≤ z)

这个区域是:

{(x,y): x > 0, y > 0, min(x,y) ≤ z}

它不是简单的一条线,而是二维平面中的一大片区域。所以最后还是要转成概率区域积分,通常比分布函数法麻烦。


并联系统则相反,两个部件都坏了系统才停止,所以寿命为

T = max(X,Y)

这时求分布函数特别方便:

F_T(t) = P(T ≤ t)

即:

F_T(t) = P(max(X,Y) ≤ t)

这等价于:

X ≤ t 且 Y ≤ t

所以:

F_T(t) = P(X ≤ t, Y ≤ t)

因为 X 和 Y 独立:

F_T(t) = P(X ≤ t)P(Y ≤ t)

代入:

F_T(t) = (1 - e^(-αt))(1 - e^(-βt)), t > 0

再求导:

f_T(t) = αe^(-αt)(1 - e^(-βt)) + βe^(-βt)(1 - e^(-αt)), t > 0


所以这类题可以总结成两条非常常考的规则:

串联系统:

Z = min(X,Y)

优先用生存函数:

P(Z > z) = P(X > z, Y > z)

若独立:

P(Z > z) = P(X > z)P(Y > z)

并联系统:

T = max(X,Y)

优先用分布函数:

P(T ≤ t) = P(X ≤ t, Y ≤ t)

若独立:

P(T ≤ t) = P(X ≤ t)P(Y ≤ t)


因此你的理解可以整理成一句更准确的话:

对于由 X、Y 构成的新随机变量,特别是 min(X,Y)、max(X,Y) 这种非一一变换,不能把原来的密度函数直接“代进去”得到新变量密度。通常应先根据事件关系求新变量的分布函数,最后对分布函数求导得到密度函数。

这个题就是典型的“系统寿命 + 指数分布 + 串并联 + 最小值最大值分布”的考法。串联看 min,并联看 maxmin 常用生存函数,max 常用分布函数。

这种类型的题目与可以直接通过概率密度,然后去求f(x,y)的概率密度的区别在哪?

可以这样区分:

能“直接用概率密度变换公式”的题,本质上是变量变换题;而 min(X,Y)max(X,Y) 这种题,本质上是事件关系题。

这两类题最大的区别在于:原来的随机变量和新随机变量之间,是否存在一一对应关系。


假设原来有二维随机变量 (X,Y),现在定义新的二维随机变量:

U = X + Y

V = Y

这时从 (X,Y)(U,V) 是可以反解的:

Y = V

X = U - V

也就是说,给定 (U,V),可以唯一确定原来的 (X,Y)。这种情况就是“二维到二维、一一对应”的变量变换题。

于是可以用概率密度变换公式:

f_UV(u,v) = f_XY(u-v, v) × |∂(x,y)/∂(u,v)|

这里的核心是:新变量 (U,V) 和旧变量 (X,Y) 维数相同,并且可以互相唯一确定。所以密度可以通过“代入 + 雅可比因子”来转化。

这类题考研中常见形式是:

U = X + Y, V = X - Y

U = X/Y, V = Y

U = X, V = XY

U = X + Y, V = X

只要能反解出:

x = x(u,v)

y = y(u,v)

并且雅可比不为 0,就可以按变量替换公式做。


但系统寿命这道题不是这种类型。它定义的是:

Z = min(X,Y)

这是从二维随机变量 (X,Y) 变成一维随机变量 Z

问题在于,给定 Z = z,无法唯一反推出 (X,Y)

例如:

min(2,3) = 2

min(2,10) = 2

min(2,100) = 2

min(2,2.5) = 2

所以 Z = 2 对应的不是原平面中的一个点,而是一大批可能的 (X,Y)。这就是“多对一”的变换,不是一一变换。

因此不能写成:

f_Z(z) = f_XY(?, ?) × 雅可比因子

因为根本没有唯一的 x(z), y(z) 可以代进去。


这里可以用一句话抓住区别:

变量变换公式解决的是“点到点”的密度转移;而 min(X,Y)max(X,Y) 解决的是“区域事件”的概率累积。

对于 Z = min(X,Y),要求:

F_Z(z) = P(Z ≤ z)

也就是:

P(min(X,Y) ≤ z)

这个事件对应的是二维平面中的一个区域,而不是某一个点。所以应该先算区域概率,再求导得到密度。

更方便的是算对立事件:

P(Z > z) = P(min(X,Y) > z)

而:

min(X,Y) > z

等价于:

X > z 且 Y > z

所以:

P(Z > z) = P(X > z, Y > z)

若 X、Y 独立,则:

P(Z > z) = P(X > z)P(Y > z)

这就是为什么这道题要先转成分布函数或生存函数。


不过要注意一点:这类题也不是完全不能“用密度”。它只是不能用那种简单的“代入密度 + 雅可比”的方法。

比如 Z = min(X,Y),也可以直接从密度角度理解:

Zz 附近取值,意味着两种情况之一:

第一种:Xz 附近坏掉,同时 Y > z

第二种:Yz 附近坏掉,同时 X > z

所以密度可以写成:

f_Z(z) = f_X(z)P(Y > z) + f_Y(z)P(X > z)

代入指数分布:

f_X(z) = αe^(-αz)

f_Y(z) = βe^(-βz)

P(X > z) = e^(-αz)

P(Y > z) = e^(-βz)

于是:

f_Z(z) = αe^(-αz)e^(-βz) + βe^(-βz)e^(-αz)

整理得:

f_Z(z) = (α + β)e^(-(α+β)z)

这和先求分布函数再求导的结果一样。

但是这个“密度法”本质上仍然是在分析事件,而不是做普通变量替换。


所以两类题的判断标准可以整理成这样:

类型典型形式能不能直接用密度变换公式原因
一一变量变换U=X+Y, V=Y可以新旧变量维数相同,能唯一反解
多对一变量变换Z=X+Y不能直接代入,但可用卷积二维变一维,给定 Z 不能唯一确定 X,Y
最值变量Z=min(X,Y)T=max(X,Y)不能直接代入一个 z 对应一大片区域
事件型构造Z=min(X,Y)T=max(X,Y)优先用分布函数事件关系最清楚

考研里可以按这个规则快速判断:

如果题目让求 (U,V) 的联合密度,并且 U,V 都由 X,Y 变来,优先考虑“变量变换 + 雅可比”。

如果题目只定义一个新变量,比如:

Z = X + Y

Z = XY

Z = X/Y

Z = min(X,Y)

Z = max(X,Y)

这时通常不能直接代入密度。要么补一个辅助变量转成二维变换,要么用分布函数法。

其中:

Z = X + Y 常用卷积;

Z = XYZ = X/Y 常用辅助变量加雅可比;

Z = min(X,Y)Z = max(X,Y) 常用分布函数。


因此这道系统寿命题和普通密度变换题的本质区别就是:

普通密度变换题是在做“坐标变换”;系统寿命题是在做“事件转化”。

串联系统寿命 min(X,Y),关注的是“至少一个坏了”或“两个都还没坏”。

并联系统寿命 max(X,Y),关注的是“两个都坏了”或“至少一个还没坏”。

所以这类题最稳的入口不是密度公式,而是事件等价关系。

相互独立正态随机变量的线性组合仍服从正态分布

63 题选 A:与 μ 无关,与 σ² 有关

64 题答案是:

μ = 1/2

这两题本质上都在考同一个知识点:相互独立正态随机变量的线性组合仍服从正态分布,并且均值、方差按线性组合规则计算。


63 题解析

题目条件是:

X, Y 相互独立
X ~ N(μ, σ²)
Y ~ N(μ, σ²)

要求判断:

P{|X - Y| < 1}

是否与 μ、σ² 有关。

因为 X 和 Y 独立,且都是正态分布,所以它们的差仍然服从正态分布。

设:

Z = X - Y

则:

E(Z) = E(X - Y) = E(X) - E(Y) = μ - μ = 0

方差为:

D(Z) = D(X - Y)
     = D(X) + D(Y)
     = σ² + σ²
     = 2σ²

这里之所以是加号,是因为 X 和 Y 相互独立。减法不会让方差相减,方差衡量的是波动程度,线性组合里系数要平方:

D(aX + bY) = a²D(X) + b²D(Y)

所以:

X - Y ~ N(0, 2σ²)

因此:

P{|X - Y| < 1}
= P{|Z| < 1}

这个概率只由 Z 的分布决定,而 Z 的分布是:

N(0, 2σ²)

其中均值已经变成 0,不含 μ;但方差是 2σ²,仍然含 σ²。

所以它 与 μ 无关,与 σ² 有关

答案:

A

这道题容易错在把 X - Y 的均值和方差混在一起。均值确实相减,导致 μ 抵消;但方差不是相减,而是因为独立而相加。


64 题解析

题目条件是:

X 与 Y 相互独立
X ~ N(μ, 1/2)
Y ~ N(μ, 1/2)
P{X + Y < 1} = 1/2

求 μ。

设:

S = X + Y

因为 X、Y 独立且服从正态分布,所以 S 仍然服从正态分布。

先求均值:

E(S) = E(X + Y) = E(X) + E(Y) = μ + μ = 2μ

再求方差:

D(S) = D(X + Y)
     = D(X) + D(Y)
     = 1/2 + 1/2
     = 1

所以:

X + Y ~ N(2μ, 1)

题目给出:

P{X + Y < 1} = 1/2

正态分布有一个非常重要的性质:正态分布关于它的均值对称

如果:

S ~ N(a, σ²)

那么:

P{S < a} = 1/2

也就是说,正态分布中,小于均值的概率正好是 1/2。

现在题目说:

P{S < 1} = 1/2

而 S 的均值是:

所以必须有:

1 = 2μ

因此:

μ = 1/2

答案:

1/2

这道题的关键不是查表,而是抓住正态分布的对称性。看到 P{某个正态变量 < 某个数} = 1/2,第一反应应该是:这个“某个数”就是该正态变量的均值。


相关知识点总结

这两题都属于考研数学概率论里非常常见的题型:正态随机变量线性组合的分布

如果:

X ~ N(μ₁, σ₁²)
Y ~ N(μ₂, σ₂²)

并且 X、Y 相互独立,那么:

aX + bY ~ N(aμ₁ + bμ₂, a²σ₁² + b²σ₂²)

特别常用的几个形式是:

X + Y ~ N(μ₁ + μ₂, σ₁² + σ₂²)

X - Y ~ N(μ₁ - μ₂, σ₁² + σ₂²)

注意,X - Y 的方差仍然是:

σ₁² + σ₂²

不是:

σ₁² - σ₂²

因为:

D(X - Y) = D(X) + D(-Y)
         = D(X) + (-1)²D(Y)
         = D(X) + D(Y)

这是这类题最容易出错的地方。

如果 X、Y 不独立,则要多出协方差项:

D(aX + bY)
= a²D(X) + b²D(Y) + 2abCov(X,Y)

例如:

D(X - Y)
= D(X) + D(Y) - 2Cov(X,Y)

所以题目中特意强调“相互独立”,就是为了让协方差为 0,从而直接用方差相加。


正态分布对称性的常见用法

如果:

X ~ N(μ, σ²)

那么正态分布关于 μ 对称,因此:

P{X < μ} = 1/2

P{X > μ} = 1/2

所以如果题目给出:

P{X < a} = 1/2

并且 X 是正态分布,那么通常可以直接得到:

a = μ

64 题正是这个考法。

它不是让我们去查标准正态分布表,而是让我们识别:

X + Y ~ N(2μ, 1)

又因为:

P{X + Y < 1} = 1/2

所以 1 是 X + Y 的均值。


这类题的快速识别方法

遇到下面这些表达,要立刻想到“线性组合正态分布”:

X + Y
X - Y
aX + bY
P{X + Y < c}
P{|X - Y| < c}

解题步骤固定为三步。

第一步,设新变量:

Z = aX + bY

第二步,求新变量的分布:

E(Z) = aE(X) + bE(Y)

D(Z) = a²D(X) + b²D(Y)

如果 X、Y 独立,直接相加;如果不独立,要补协方差项。

第三步,根据题目要求求概率或反求参数。

63 题是判断概率与参数的关系,所以只需要看 X - Y 的分布里还剩哪些参数。

64 题是利用 P{正态变量 < 均值} = 1/2 反求 μ。

相关系数 ρ = 0

这题选 D:1/2

题目是:

(X, Y) ~ N(0, 0; σ², σ²; 0)

求 P{X < 2Y}

这里的关键有两个:

第一,(X, Y)二维正态分布,不是一维正态分布。

第二,最后那个 0 表示 相关系数 ρ = 0,不是新的随机变量,也不是第五个“分布参数”之外的东西。


一维正态分布确实通常写成:

X ~ N(μ, σ²)

它只有两个参数:

μ:均值
σ²:方差

但二维正态分布描述的是两个随机变量 X、Y 的联合分布,因此除了分别给出 X 和 Y 的均值、方差之外,还要说明它们之间的相关关系。

二维正态分布常写成:

(X, Y) ~ N(μ₁, μ₂; σ₁², σ₂²; ρ)

其中:

μ₁ = E(X)
μ₂ = E(Y)

σ₁² = D(X)
σ₂² = D(Y)

ρ = X 与 Y 的相关系数

所以题目中的:

(X, Y) ~ N(0, 0; σ², σ²; 0)

意思是:

E(X) = 0
E(Y) = 0

D(X) = σ²
D(Y) = σ²

ρXY = 0

最后一个 0 就是相关系数:

ρXY = 0

它表示 X 和 Y 不相关。而在二维正态分布中,若相关系数为 0,则 X 和 Y 还可以进一步推出 相互独立

这是二维正态分布里非常重要的结论:

二维正态 + ρ = 0  ⇒  X 与 Y 相互独立

但这道题其实即使不强调独立,也可以直接用协方差为 0 来算。


要求:

P{X < 2Y}

先把不等式移到一边:

X < 2Y

X - 2Y < 0

令:

Z = X - 2Y

因为 X、Y 服从二维正态分布,所以它们的线性组合仍然服从正态分布。也就是说:

Z = X - 2Y

一定还是正态随机变量。

下面求 Z 的均值和方差。

均值:

E(Z) = E(X - 2Y)
     = E(X) - 2E(Y)
     = 0 - 2 × 0
     = 0

方差:

D(Z) = D(X - 2Y)
     = D(X) + 4D(Y) - 4Cov(X, Y)

又因为相关系数:

ρXY = 0

而:

Cov(X, Y) = ρXY · σX · σY

所以:

Cov(X, Y) = 0

因此:

D(Z) = σ² + 4σ²
     = 5σ²

所以:

Z = X - 2Y ~ N(0, 5σ²)

于是原概率变成:

P{X < 2Y}
= P{X - 2Y < 0}
= P{Z < 0}

而 Z 是均值为 0 的正态分布。正态分布关于均值对称,所以:

P{Z < 0} = 1/2

因此:

P{X < 2Y} = 1/2

选:

D

这道题最容易错的地方在于看到 X < 2Y 后,想把它变成:

P{X < 2Y} = F_X(2Y)

这是不对的。因为 2Y 不是一个常数,而是随机变量。不能直接把随机变量代入 X 的分布函数。

这类题的标准做法是:看到正态变量之间的不等式,优先把它整理成一个线性组合。

例如:

P{X < 2Y}

要转化为:

P{X - 2Y < 0}

然后研究:

Z = X - 2Y

的分布。

只要 (X, Y) 是二维正态,那么 aX + bY 一定是一维正态。接下来只需要求均值和方差,再用正态分布性质即可。


关于二维正态的五个参数,可以这样记:

两个均值 + 两个方差 + 一个相关系数

即:

N(μ₁, μ₂; σ₁², σ₂²; ρ)

其中 ρ 的作用是刻画 X 和 Y 之间的线性相关程度。

如果:

ρ > 0

说明 X 和 Y 正相关。

如果:

ρ < 0

说明 X 和 Y 负相关。

如果:

ρ = 0

说明 X 和 Y 不相关。

对于一般随机变量,“不相关”不一定等于“独立”;但对于二维正态分布来说:

ρ = 0 ⇔ X 与 Y 相互独立

这是考研概率论里很常考的结论。

第79题不选 A,核心原因是:Y = 1/3 对连续型随机变量来说是一个概率为 0 的事件,不能直接套用普通条件概率公式。

普通条件概率公式是:

P(A | B) = P(AB) / P(B)

但这个公式要求:

P(B) > 0

本题中 Y 是连续型随机变量,所以取某一个具体值的概率为 0:

P(Y = 1/3) = 0

同时:

P(X < 1/2, Y = 1/3) = 0

所以 A 选项实际上变成:

0 / 0

这是没有意义的,不能作为条件概率的定义。


这类题考的是“连续型随机变量在给定 Y = y 条件下的条件分布”。虽然 P(Y = 1/3) = 0,但可以通过条件密度来定义:

f<sub>X|Y</sub>(x | y) = f(x,y) / f<sub>Y</sub>(y)

其中:

f<sub>Y</sub>(y) = ∫<sub>-∞</sub><sup>+∞</sup> f(x,y) dx

因此:

P(X < 1/2 | Y = 1/3)

应该写成:

∫<sub>-∞</sub><sup>1/2</sup> f<sub>X|Y</sub>(x | 1/3) dx

所以选 B


A 选项的错误本质是:把离散型随机变量的思路直接套到了连续型随机变量上。

如果 Y 是离散型随机变量,并且 P(Y = 1/3) > 0,那么 A 是可以用的:

P(X < 1/2 | Y = 1/3) = P(X < 1/2, Y = 1/3) / P(Y = 1/3)

但本题明确说 (X,Y) 是二维连续型随机变量,所以 Y = 1/3 这种“精确取值事件”概率为 0,A 不成立。


顺带看一下 C 为什么也不对。

C 是:

∫<sub>-∞</sub><sup>1/2</sup> f(x,y) dx

如果这里把 y 理解成 1/3,那就是:

∫<sub>-∞</sub><sup>1/2</sup> f(x,1/3) dx

它积分的是联合密度在直线 y = 1/3 上的截面,不是概率。因为二维连续型随机变量求概率必须对一个“面积区域”积分,而不是只沿着一条线积分。

它和正确答案的关系是:

∫<sub>-∞</sub><sup>1/2</sup> f(x,1/3) dx = f<sub>Y</sub>(1/3) · P(X < 1/2 | Y = 1/3)

所以它少除以了一个 f<sub>Y</sub>(1/3)


这类题的快速判断方法是:

看到连续型随机变量里出现:

P(X < a | Y = b)

不要用:

P(X < a, Y = b) / P(Y = b)

而要立刻想到条件密度:

P(X < a | Y = b) = ∫<sub>-∞</sub><sup>a</sup> f<sub>X|Y</sub>(x | b) dx

其中:

f<sub>X|Y</sub>(x | b) = f(x,b) / f<sub>Y</sub>(b)

这就是本题不选 A,而选 B 的根本原因。

文末附加内容
暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇