1. 数据分布与概率分布
1.1. 数据分布
数据分布的一般性定义: 从特定数据到一般规律的抽象。
1.2. 随机变量
$def.$ 随机变量
给定的样本空间为 $\Omega = \{\omega\}$,若对于每一个样本点 $\omega \in\Omega$,都有唯一确定的 $X(\omega)$ 与之对应,则称 $X(\omega)$ 是一个随机变量,简记为 $X$, 即:
$def.$ 分布函数
随机变量 $X$ 的分布函数定义为
$lemma.$ 分布函数基本性质
对于任意随机变量 $X$,其分布函数 $F(x)$ 具有以下的性质:
1.3. 离散随机变量
$def.$ 离散型随机变量
一个随机变量的可能(概率非零)取值至多可列个,则称它为离散型随机变量。$X=x_i$ 的概率标记为
1.4. 连续随机变量
$def.$ 连续随机变量
对于随机变量 $X$ 及其分布函数 $F(x)$,如存在非负可积函数 $f(x)$,满足 $\forall x:F(x) = \int_{-\infty}^{+\infty}f(t)dt$ ,则称 $X$ 为连续随机变量,$f(x)$ 称为 $X$ 的概率密度函数
$thm.$ 连续随机变量性质
-
若 $F$ 在点 $x$ 处连续,则 $F'(x) = f(x)$
-
连续随机变量 $X$ 的任意一点概率为 $0$ , 即有
$$\forall x:P(X=x)=0 $$
1.5. 随机变量的函数的分布
$thm.$ 函数的分布定理
$X$ 的密度函数为 $f_X(x)$,$-\infty<x<+\infty$,$Y = g(X)$ 严格单调,即 $g'(x)>0$ 或 $g'(x)<0$,则 $Y$ 的密度函数为:
其中
2. 期望与矩
2.1. 原点矩
$def.$ 原点矩
给定一批数据 $x_1,x_2,x_3,…,x_n$,其 $k$ 阶原点矩 $A_k \triangleq \frac{1}{n}\displaystyle{\sum_{i = 1}^{n}x_i^k}$
$def.$ Expected Value
离散随机变量 $X$ 的数学期望定义为
连续随机变量 $X$ 的数学期望定义为
这里要求 $\displaystyle{\sum_{i = 1}^\infty}x_ip_i$ 和 $\int_{-\infty}^{+\infty}xf(x)dx$ 绝对收敛
$thm.$ Properties
随机变量的数学期望有如下性质
- $E(C) = C \ (C\in \mathbb{R})$
- $E(CX) = CE(X)\ (C\in \mathbb{R})$
- $E(X\pm Y) = E(X)\pm E(Y)$
- $E(XY) = E(X)E(Y) \ iff.X,Y\ are\ independent$
2.2. 中心矩
$def.$ 中心矩
给定随机变量 $X$,若 $E((X-E(X))^k)$ 存在,则其 $k$ 阶中心矩定义为 $E((X-E(X))^k)$
$def.$ 方差与标准差
$X$ 随机变量的二姐中心矩为方差,记作 $\sigma^2(X)$ 或 $Var(X)$ 或 $D(X)$ ,而 $\sqrt{Var(X)}$ 称为 $X$ 的标准差,记为 $\sigma(X)$
$thm.$ Calculation
$thm.$ Properties
-
设 $C$ 为常数, 则 $D(C) = 0$
-
设 $X$ 是随机变量, $C$ 是常数, 则
$$\begin {array}{c} D(X+C)=D(X)\\ D(CX) = C^2D(X) \end {array} $$ -
设随机变量 $X$ 与 $Y$ 相互独立, 则:
$$D(X\pm Y) = D(X) + D(Y) $$
3. 矩的数学工具
3.1. 微分恒等式
$def.$ 微分恒等式法
$\alpha,\beta,\omega$ 是一些参数,$\exists c\in\mathbb{N},s.t.n_{min},n_{max}\leq c$,设
其中 $f$ 和 $g$ 是关于 $\alpha$ 的可微函数. 如果 $f$ 退化到足以保证求和和求微分的次序可以交换,则
3.2. 矩生成函数
$def.$ 矩生成函数
随机变量 $X$ 的矩生成函数
其中 $M_X(s)$ 存在 $\iff \exists\delta\in\mathbb{R},s.t. \forall s\in [-\delta,\delta],M_X(s) \ is\ finite$
$thm.$ 矩生成定理
假设随机变量 $X$ 的矩生成函数 $M_X(s)$ 存在,则:
3.3. 矩生成函数的性质
$thm.$ 矩生成函数唯一性定理
对于两随机变量 $X$ 和 $Y$ ,假设存在常数 $\delta$ ,使得 $M_X(s)$ 和 $M_Y(s)$ 对于任意 $s\in[-\delta,\ \delta]$ 存在且相等,则 $X$ 和 $Y$ 的分布函数相等,即
$thm.$ 矩生成函数可加性定理
$X_i(i = 1,\ 2,\ …,\ n)$ 为独立随机变量,则