Loading [MathJax]/jax/element/mml/optable/BasicLatin.js


8. Multivariate Probability Distribution

Multivariate Probability Distribution

1. 多维概率分布

1.1. 联合分布

def. 二维随机变量

设样本空间为 Ω=eX=X(e),和 Y=Y(e),是定义在 Ω 上的随机变量,由他们构成的一个变量 (X,Y) 叫做二维随机变量或二维随机向量

def. 联合分布

(X,Y) 是二维随机变量, x,y 是任意实数,称二元函数

F(x,y)=P(XxYy)=P(Xx,Yy)

为二元随机变量 (X,Y) 的联合分布函数

def. 二维离散随机变量概率分布律

若二维随机变量的可能取值只有有限个或者可列无穷个,则称二维随机变量为离散型随机变量。二维离散型随机变量 (X,Y) 的所有可能取值为 (xi,yi),(i=1,2,,n),则称

P{X=xi,Y=yi}=pij

为二维离散行随机变量 (X,Y) 的概率分布律,简称分布律

注意,二维离散随机变量的概率分布仍然满足概率的公理化定义:非负性,规范性,可列可加性(级数)

def. 二位连续随机变量的概率密度

设二维随机变量 (X,Y) 的分布函数为 F(x,y),如果存在非负函数 f(x,y),使得 x,yR,都有

F(x,y)=xyf(s,t)dsdt

则称 (X,Y) 为二位连续随机变量,并称非负函数 f(x,y)(X,Y) 的概率密度函数,或称 f(x,y)XY 的联合概率密度.

注意,二维连续随机变量的概率分布仍然满足概率的公理化定义:非负性,规范性,可列可加性(级数),在此基础上,我们还有

f(x,y)=2F(x,y)xy

1.2. 边缘分布

def. 二维随机变量的边缘分布

(X,Y) 为二维随机变量,称一维随机变量 XY 的概率分布为二维随机变量 (X,Y) 关于 XY 对应的边缘分布,分别记作 FX(x),FY(y)

def. 二维离散随机变量的边缘分布律

设二维随机变量 (X,Y) 的分布律为 pij,那么对于随机变量 XY 其各自的分布律对于固定的 i,j=1,2,, 满足

P{X=xi}=jpij=pi

则称 pi 为随机变量 (X,Y) 的边缘分布律。

def. 二维连续随机变量的边缘概率密度

设二维随机变量 (X,Y) 的概率密度为 f(x,y),边缘概率密度 fX(x)fY(y) 定义为

fX(x)=+f(x,y)dyfY(y)=+f(x,y)dx

1.3. 条件分布

def. 离散型随机变量的条件概率

(X,Y) 是二维离散型随机变量,其分布律为 P{X=xi,Y=yi}=pij,其边缘概率分别为 pi pj,则条件概率定义为

P{X=xi|Y=yi}=P{X=xi,Y=yi}P{Y=yi}=pijpjP{Y=yi|X=xi}=P{X=xi,Y=yi}P{X=xi}=pijpi

def. 连续型随机变量的条件概率

(X,Y) 是二维连续型随机变量,其概率密度为 f(x,y),其边缘改率分别为 fX(x),fY(y),则条件概率定义为

fX|Y(x|y)=f(x,y)fY(y)fY|X(y|x)=f(x,y)fX(x)

连续型随机变量的条件概率分布定义为

FX|Y(x|y)=P{Xx|Y=y}=xf(x,y)fY(y)dxFY|X(y|x)=P{Yy|X=x}=yf(x,y)fX(x)dy

1.4. 独立性

def. 独立性

二维随机变量 (X,Y) 的分布函数及其边缘分布函数分别设为 F(x,y)FX(x), FY(y),若

(x,y):F(x,y)=FX(x)FY(y)

则称随机变量 XY 是相互独立的

def. 离散随机变量的独立性

离散二维随机变量 (X,Y) 的联合分布律和边缘分布律分别设为 pijpi, pj,若

(ij):pij=pi×pj

则称随机变量 XY 是相互独立的

def. 连续随机变量的独立性

连续二维随机变量 (X,Y) 的联合分布律和边缘分布律分别设为 f(x,y)fX(x), fY(y),若

(x,y):f(x,y)=fX(x)×fY(y)

则称随机变量 XY 是相互独立的

2. 多维分布的矩

2.1. 独立性的多维矩

thm. 已知 XY 相互独立,则有:

E(XY)=E(X)E(Y)

thm. 已知 XY 相互独立,则有:

D(X+Y)=D(X)+D(Y)

2.2. 相关性的多维矩

def. 协方差

随机变量 XY 的协方差定义为

Cov(X,Y)E(XE(X))E(YE(Y))

def. 协方差计算

Cov(X,Y)=E(XY)E(X)E(Y)

inf. 对于任意随机变量 X,Y,Z,不难得出:

Cov(X,Y)=Cov(Y,X)Cov(a,a)=0Cov(aX,bY)=abCov(X,Y)Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z)

inf. 对于任意随机变量 X,Y:

D(X±Y)=D(X)+D(Y)±2Cov(X,Y)

inf.XY 相互独立,则:

Cov(X,Y)=0

def. Pearson 相关系数

关于 Pearson 相关系数的更具体的介绍, 可以查看我的这篇文章

协方差的数值会收到 X,Y 的量纲的影响,为了更加客观地度量变量之间的关系,我们将协方差归一化,定义为相关系数。若随机变量 XY 的数学期望和方差都存在,则称:

ρXY=Cov(X,Y)D(X)D(Y)

为随机变量 XY 的相关系数

def. Schwarz 不等式

Cov2(X,Y)σ2Xσ2Y

inf. 相关系数归一性

|ρXY|1

thm. 线性相关定理

|ρXY|=1 的充要条件是 X,Y 几乎处处线性相关

3. Common Bivariate Distributions

3.1. Bivariate Uniform Distribution

def. 二维均匀分布

G 是平面上的有界闭区域,其面积为 A,若二维随机变量 (X,Y) 具有概率密度

(x,y)G:f(x,y)=1A(x,y)G:f(x,y)=0

则称 (X,Y)G 上二维均匀分布

3.2. Bivariate Normal Distribution

如果随机变量 (X,Y) 的概率密度为

f(x,y)=12πσ1σ21ρ2exp(12(1ρ)2[(xμ1)2σ212ρ(xμ1)(yμ2)σ1σ2+(yμ2)2σ22])(<x,y<+)

则称 (X,Y) 服从参数为 μ1,μ2,σ1,σ2,ρ 的二维正态分布,记为

(X,Y)N(μ1,μ2,σ21,σ22,ρ)

实际上, Multivariate Normal distribution 的形式也是高度类似的. 如果 d 维随机变量 X=(X1,X2,,Xd)T 服从 Normal Distribution, 那我们记作

XN(μ,Σ)

概率密度函数 (PDF) 为

fX(x)=exp(12(xμ)TΣ1(xμ))(2π)d|Σ|

其中:

  • μRdxRd 的均值向量
  • ΣRd×dxRd 的协方差矩阵

实际上, (xμ)TΣ1(xμ) 叫做马哈拉诺比斯距离 (Mahalanobis Distance)

4. 函数的概率分布

4.1. 离散函数的分布

4.2. 连续函数的分布

thm. 函数的分布定理

X 的密度函数为 fX(x)<x<+Y=g(X) 严格单调,即 g(x)>0g(x)<0,则 Y 的密度函数为:

fY(x)=fX(h(y))|h(y)|(a<y<b)

其中

a=min

4.3. 极值函数的分布