1. 多维概率分布
1.1. 联合分布
$def.$ 二维随机变量
设样本空间为 $\Omega = e$,$X = X(e)$,和 $Y = Y(e)$,是定义在 $\Omega$ 上的随机变量,由他们构成的一个变量 $(X,Y)$ 叫做二维随机变量或二维随机向量
$def.$ 联合分布
设 $(X,Y)$ 是二维随机变量, $x,y$ 是任意实数,称二元函数
为二元随机变量 $(X,Y)$ 的联合分布函数
$def.$ 二维离散随机变量概率分布律
若二维随机变量的可能取值只有有限个或者可列无穷个,则称二维随机变量为离散型随机变量。二维离散型随机变量 $(X,Y)$ 的所有可能取值为 $(x_i,y_i),(i=1,2,…,n)$,则称
为二维离散行随机变量 $(X,Y)$ 的概率分布律,简称分布律
注意,二维离散随机变量的概率分布仍然满足概率的公理化定义:非负性,规范性,可列可加性(级数)
$def.$ 二位连续随机变量的概率密度
设二维随机变量 $(X,Y)$ 的分布函数为 $F(x,y)$,如果存在非负函数 $f(x,y)$,使得 $\forall x,y\in\mathbb{R}$,都有
则称 $(X,Y)$ 为二位连续随机变量,并称非负函数 $f(x,y)$ 为 $(X,Y)$ 的概率密度函数,或称 $f(x,y)$ 为 $X$ 和 $Y$ 的联合概率密度.
注意,二维连续随机变量的概率分布仍然满足概率的公理化定义:非负性,规范性,可列可加性(级数),在此基础上,我们还有
$$f(x,y) = \frac{\partial^2F(x,y)}{\partial x\partial y} $$
1.2. 边缘分布
$def.$ 二维随机变量的边缘分布
设 $(X,Y)$ 为二维随机变量,称一维随机变量 $X$ 或 $Y$ 的概率分布为二维随机变量 $(X,Y)$ 关于 $X$ 或 $Y$ 对应的边缘分布,分别记作 $F_X(x), F_Y(y)$
$def.$ 二维离散随机变量的边缘分布律
设二维随机变量 $(X,Y)$ 的分布律为 $p_{ij}$,那么对于随机变量 $X$,$Y$ 其各自的分布律对于固定的 $i,j = 1,2,…$, 满足
则称 $p_i$ 为随机变量 $(X,Y)$ 的边缘分布律。
$def.$ 二维连续随机变量的边缘概率密度
设二维随机变量 $(X,Y)$ 的概率密度为 $f(x,y)$,边缘概率密度 $f_X(x)$ 和 $f_Y(y)$ 定义为
1.3. 条件分布
$def.$ 离散型随机变量的条件概率
设 $(X,Y)$ 是二维离散型随机变量,其分布律为 $P\{X=x_i,Y=y_i\}=p_{ij}$,其边缘概率分别为 $p_{i\cdot}\ p_{\cdot j}$,则条件概率定义为
$def.$ 连续型随机变量的条件概率
设 $(X,Y)$ 是二维连续型随机变量,其概率密度为 $f(x,y)$,其边缘改率分别为 $f_X(x), f_Y(y)$,则条件概率定义为
连续型随机变量的条件概率分布定义为
1.4. 独立性
$def.$ 独立性
二维随机变量 $(X,Y)$ 的分布函数及其边缘分布函数分别设为 $F(x,y)$ 和 $F_X(x),\ F_Y(y)$,若
则称随机变量 $X$ 和 $Y$ 是相互独立的
$def.$ 离散随机变量的独立性
离散二维随机变量 $(X,Y)$ 的联合分布律和边缘分布律分别设为 $p_{ij}$ 和 $p_{i\cdot},\ p_{\cdot j}$,若
则称随机变量 $X$ 和 $Y$ 是相互独立的
$def.$ 连续随机变量的独立性
连续二维随机变量 $(X,Y)$ 的联合分布律和边缘分布律分别设为 $f(x,y)$ 和 $f_X(x),\ f_Y(y)$,若
则称随机变量 $X$ 和 $Y$ 是相互独立的
2. 多维分布的矩
2.1. 独立性的多维矩
$thm.$ 已知 $X$ 和 $Y$ 相互独立,则有:
$thm.$ 已知 $X$ 和 $Y$ 相互独立,则有:
2.2. 相关性的多维矩
$def.$ 协方差
随机变量 $X$ 和 $Y$ 的协方差定义为
$def.$ 协方差计算
$inf.$ 对于任意随机变量 $X,Y,Z$,不难得出:
$inf.$ 对于任意随机变量 $X,Y:$
$inf.$ 若 $X$ 与 $Y$ 相互独立,则:
$def.$ $\text{Pearson}$ 相关系数
关于 $\text{Pearson}$ 相关系数的更具体的介绍, 可以查看我的这篇文章
协方差的数值会收到 $X,Y$ 的量纲的影响,为了更加客观地度量变量之间的关系,我们将协方差归一化,定义为相关系数。若随机变量 $X$ 和 $Y$ 的数学期望和方差都存在,则称:
为随机变量 $X$ 和 $Y$ 的相关系数
$def.$ $\text{Schwarz}$ 不等式
$inf.$ 相关系数归一性
$thm.$ 线性相关定理
$|\rho_{XY}|=1$ 的充要条件是 $X,Y$ 几乎处处线性相关
3. Common Bivariate Distributions
3.1. Bivariate Uniform Distribution
$def.$ 二维均匀分布
设 $G$ 是平面上的有界闭区域,其面积为 $A$,若二维随机变量 $(X,Y)$ 具有概率密度
则称 $(X,Y)$ 在 $G$ 上二维均匀分布
3.2. Bivariate Normal Distribution
如果随机变量 $(X,Y)$ 的概率密度为
则称 $(X,Y)$ 服从参数为 $\mu_1,\mu_2,\sigma_1,\sigma_2,\rho$ 的二维正态分布,记为
实际上, Multivariate Normal distribution 的形式也是高度类似的. 如果 $d$ 维随机变量 $\boldsymbol X=(X_1,X_2,\ldots,X_d)^{\mathsf T}$ 服从 Normal Distribution, 那我们记作
概率密度函数 (PDF) 为
其中:
- $\boldsymbol \mu\in \mathbb R^d$ 为 $\boldsymbol x\in \mathbb R^d$ 的均值向量
- $\boldsymbol \Sigma\in \mathbb R^{d\times d}$ 为 $\boldsymbol x\in \mathbb R^d$ 的协方差矩阵
实际上, $\sqrt{(\boldsymbol{x}-\boldsymbol{\mu})^{\mathsf T} \Sigma^{-1}(\boldsymbol{x}-\boldsymbol{\mu}})$ 叫做马哈拉诺比斯距离 ($\text{Mahalanobis}$ Distance)
4. 函数的概率分布
4.1. 离散函数的分布
4.2. 连续函数的分布
$thm.$ 函数的分布定理
$X$ 的密度函数为 $f_X(x)$,$-\infty<x<+\infty$,$Y = g(X)$ 严格单调,即 $g'(x)>0 $ 或 $ g'(x)<0$,则 $Y$ 的密度函数为:
其中