在概率论与数理统计中,多元正态分布是一种重要的概率分布形式,它广泛应用于金融分析、机器学习以及信号处理等领域。本文将对多元正态分布的一些基本性质进行深入探讨,并通过严谨的数学推导加以证明。
一、定义回顾
首先,我们回顾一下多元正态分布的定义。假设随机向量 \(\mathbf{X} = (X_1, X_2, \ldots, X_n)^T\) 的联合概率密度函数为:
\[
f_{\mathbf{X}}(\mathbf{x}) = \frac{1}{(2\pi)^{n/2}|\Sigma|^{1/2}} \exp\left(-\frac{1}{2} (\mathbf{x} - \boldsymbol{\mu})^T \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu})\right)
\]
其中:
- \(\boldsymbol{\mu}\) 是均值向量;
- \(\Sigma\) 是协方差矩阵;
- \(|\Sigma|\) 表示协方差矩阵的行列式。
二、性质证明
性质1:线性变换后的分布仍是正态分布
设 \(\mathbf{Y} = A\mathbf{X} + \mathbf{b}\),其中 \(A\) 是一个 \(m \times n\) 矩阵,\(\mathbf{b}\) 是一个 \(m\)-维向量,则 \(\mathbf{Y}\) 也服从多元正态分布。
证明:
由于 \(\mathbf{X} \sim N(\boldsymbol{\mu}, \Sigma)\),其概率密度函数为上述公式所示。令 \(\mathbf{y} = A\mathbf{x} + \mathbf{b}\),则有 \(\mathbf{x} = A^{-1}(\mathbf{y} - \mathbf{b})\)(假设 \(A\) 可逆)。代入原密度函数后,经过简单的变量替换和矩阵运算,可以验证 \(\mathbf{Y}\) 的概率密度函数仍然具有多元正态分布的形式,且均值和协方差分别为:
\[
\boldsymbol{\mu}_Y = A\boldsymbol{\mu} + \mathbf{b}, \quad \Sigma_Y = A\Sigma A^T
\]
因此,线性变换后的分布仍然是多元正态分布。
性质2:边缘分布仍为正态分布
假设 \(\mathbf{X} = (\mathbf{X}_1^T, \mathbf{X}_2^T)^T\),其中 \(\mathbf{X}_1\) 和 \(\mathbf{X}_2\) 分别是 \(\mathbf{X}\) 的两个子向量。那么,\(\mathbf{X}_1\) 和 \(\mathbf{X}_2\) 的边缘分布均为正态分布。
证明:
根据多元正态分布的定义,联合概率密度函数可以写成:
\[
f_{\mathbf{X}}(\mathbf{x}) = f_{\mathbf{X}_1, \mathbf{X}_2}(\mathbf{x}_1, \mathbf{x}_2)
\]
利用条件概率公式,我们可以分离出 \(\mathbf{X}_1\) 和 \(\mathbf{X}_2\) 的边缘分布。经过计算可知,\(\mathbf{X}_1\) 和 \(\mathbf{X}_2\) 的边缘分布分别服从正态分布,其均值和协方差矩阵分别为联合分布中的相应部分。
性质3:独立性与不相关性等价
如果 \(\mathbf{X} \sim N(\boldsymbol{\mu}, \Sigma)\),则 \(\mathbf{X}_1\) 和 \(\mathbf{X}_2\) 相互独立当且仅当它们的协方差为零,即 \(\text{Cov}(\mathbf{X}_1, \mathbf{X}_2) = 0\)。
证明:
由多元正态分布的性质可知,当且仅当联合协方差矩阵的块元素为零时,两个子向量之间才相互独立。而协方差为零意味着它们之间不存在线性关系,从而保证了独立性。
三、总结
本文通过对多元正态分布的三个重要性质进行了详细的证明,包括线性变换后的分布保持正态性、边缘分布的正态性以及独立性与不相关性的等价性。这些性质不仅加深了我们对多元正态分布的理解,也为实际应用提供了坚实的理论基础。
希望以上内容能够帮助读者更好地掌握多元正态分布的相关知识,并在实践中灵活运用。