1. 多维概率分布
1.1. 联合分布
def. 二维随机变量
设样本空间为 Ω=e,X=X(e),和 Y=Y(e),是定义在 Ω 上的随机变量,由他们构成的一个变量 (X,Y) 叫做二维随机变量或二维随机向量
def. 联合分布
设 (X,Y) 是二维随机变量, x,y 是任意实数,称二元函数
为二元随机变量 (X,Y) 的联合分布函数
def. 二维离散随机变量概率分布律
若二维随机变量的可能取值只有有限个或者可列无穷个,则称二维随机变量为离散型随机变量。二维离散型随机变量 (X,Y) 的所有可能取值为 (xi,yi),(i=1,2,…,n),则称
为二维离散行随机变量 (X,Y) 的概率分布律,简称分布律
注意,二维离散随机变量的概率分布仍然满足概率的公理化定义:非负性,规范性,可列可加性(级数)
def. 二位连续随机变量的概率密度
设二维随机变量 (X,Y) 的分布函数为 F(x,y),如果存在非负函数 f(x,y),使得 ∀x,y∈R,都有
则称 (X,Y) 为二位连续随机变量,并称非负函数 f(x,y) 为 (X,Y) 的概率密度函数,或称 f(x,y) 为 X 和 Y 的联合概率密度.
注意,二维连续随机变量的概率分布仍然满足概率的公理化定义:非负性,规范性,可列可加性(级数),在此基础上,我们还有
f(x,y)=∂2F(x,y)∂x∂y
1.2. 边缘分布
def. 二维随机变量的边缘分布
设 (X,Y) 为二维随机变量,称一维随机变量 X 或 Y 的概率分布为二维随机变量 (X,Y) 关于 X 或 Y 对应的边缘分布,分别记作 FX(x),FY(y)
def. 二维离散随机变量的边缘分布律
设二维随机变量 (X,Y) 的分布律为 pij,那么对于随机变量 X,Y 其各自的分布律对于固定的 i,j=1,2,…, 满足
则称 pi 为随机变量 (X,Y) 的边缘分布律。
def. 二维连续随机变量的边缘概率密度
设二维随机变量 (X,Y) 的概率密度为 f(x,y),边缘概率密度 fX(x) 和 fY(y) 定义为
1.3. 条件分布
def. 离散型随机变量的条件概率
设 (X,Y) 是二维离散型随机变量,其分布律为 P{X=xi,Y=yi}=pij,其边缘概率分别为 pi⋅ p⋅j,则条件概率定义为
def. 连续型随机变量的条件概率
设 (X,Y) 是二维连续型随机变量,其概率密度为 f(x,y),其边缘改率分别为 fX(x),fY(y),则条件概率定义为
连续型随机变量的条件概率分布定义为
1.4. 独立性
def. 独立性
二维随机变量 (X,Y) 的分布函数及其边缘分布函数分别设为 F(x,y) 和 FX(x), FY(y),若
则称随机变量 X 和 Y 是相互独立的
def. 离散随机变量的独立性
离散二维随机变量 (X,Y) 的联合分布律和边缘分布律分别设为 pij 和 pi⋅, p⋅j,若
则称随机变量 X 和 Y 是相互独立的
def. 连续随机变量的独立性
连续二维随机变量 (X,Y) 的联合分布律和边缘分布律分别设为 f(x,y) 和 fX(x), fY(y),若
则称随机变量 X 和 Y 是相互独立的
2. 多维分布的矩
2.1. 独立性的多维矩
thm. 已知 X 和 Y 相互独立,则有:
thm. 已知 X 和 Y 相互独立,则有:
2.2. 相关性的多维矩
def. 协方差
随机变量 X 和 Y 的协方差定义为
def. 协方差计算
inf. 对于任意随机变量 X,Y,Z,不难得出:
inf. 对于任意随机变量 X,Y:
inf. 若 X 与 Y 相互独立,则:
def. Pearson 相关系数
关于 Pearson 相关系数的更具体的介绍, 可以查看我的这篇文章
协方差的数值会收到 X,Y 的量纲的影响,为了更加客观地度量变量之间的关系,我们将协方差归一化,定义为相关系数。若随机变量 X 和 Y 的数学期望和方差都存在,则称:
为随机变量 X 和 Y 的相关系数
def. Schwarz 不等式
inf. 相关系数归一性
thm. 线性相关定理
|ρXY|=1 的充要条件是 X,Y 几乎处处线性相关
3. Common Bivariate Distributions
3.1. Bivariate Uniform Distribution
def. 二维均匀分布
设 G 是平面上的有界闭区域,其面积为 A,若二维随机变量 (X,Y) 具有概率密度
则称 (X,Y) 在 G 上二维均匀分布
3.2. Bivariate Normal Distribution
如果随机变量 (X,Y) 的概率密度为
则称 (X,Y) 服从参数为 μ1,μ2,σ1,σ2,ρ 的二维正态分布,记为
实际上, Multivariate Normal distribution 的形式也是高度类似的. 如果 d 维随机变量 X=(X1,X2,…,Xd)T 服从 Normal Distribution, 那我们记作
概率密度函数 (PDF) 为
其中:
- μ∈Rd 为 x∈Rd 的均值向量
- Σ∈Rd×d 为 x∈Rd 的协方差矩阵
实际上, √(x−μ)TΣ−1(x−μ) 叫做马哈拉诺比斯距离 (Mahalanobis Distance)
4. 函数的概率分布
4.1. 离散函数的分布
4.2. 连续函数的分布
thm. 函数的分布定理
X 的密度函数为 fX(x),−∞<x<+∞,Y=g(X) 严格单调,即 g′(x)>0 或 g′(x)<0,则 Y 的密度函数为:
其中