正态分布归一化的证明


正态(高斯)分布于统计学,就如水养育生命一样重要,而掌握正态分布的一些性质及其相关证明,也是一项基本功。接下来,我们证明正态分布密度函数的归一化,这是PRML讲解正态分布时的第一个练习题,我们的证明参考了这个习题的答案,其中采用的积分方法非常巧妙。

问题的描述如下:如果随机变量$X$满足均值为$\mu$,方差为$\sigma^2$的正态分布,那么其密度函数为:

\[N(x \mid \mu ,\sigma^2)=\frac{1}{(2\pi \sigma^2)^{1/2}}exp\{-\frac{1}{2\sigma^2}(x-\mu)^2\}\]

我们要证明的是:

\[\int^{\infty}_{-\infty}N(x \mid \mu,\sigma^2)dx=1\]

问题的关键在于求解如下积分:

\[I=\int^{\infty}_{-\infty}exp(-\frac{1}{2\sigma^2}x^2)dx\]

为了求解$I$,可以先求$I^2$,而$I^2$可以写成二重积分的形式:

\[I^2 =\int^{\infty}_{-\infty}\int^{\infty}_{-\infty}exp(-\frac{1}{2\sigma^2}x^2-\frac{1}{2\sigma^2}y^2)dxdy\]

将上述二重积分转换为极坐标形式:

\[x = rcos(\theta)\] \[y = rsin(\theta)\]

$I^2$可以写成:

\[I^2=\int^{+\infty}_{0}\int^{2\pi}_{0}exp(-\frac{r^2cos^2\theta + r^2sin^2\theta}{2\sigma^2}\frac{\partial(x,y)}{\partial(r,\theta)}drd\theta\]

其中:

\[\frac{\partial(x,y)}{\partial(r,\theta)}= \left| \begin{array}{cc} \frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta} \\ \frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta} \end{array}\right|= \left| \begin{array}{cc} cos\theta & -rsin\theta \\ sin\theta & rcos\theta \end{array}\right|=rcos^2\theta + rsin^2\theta=r\]

因此:

\[I^2=\int^{+\infty}_{0}\int^{2\pi}_{0}exp(-\frac{r^2cos^2\theta + r^2sin^2\theta}{2\sigma^2})rdrd\theta\]

利用分部积分法求$I^2$:

\[I^2=-2\pi \sigma^2\int^{+\infty}_{0}exp(-\frac{r^2}{2\sigma^2})d(-\frac{r^2}{2\sigma^2})\] \[I^2=-2\pi \sigma^2exp(-\frac{r^2}{2\sigma^2})\mid^{\infty}_{0}=2\pi \sigma^2\]

从而证明了均值为0的正态分布密度函数的归一化:

\[\int^{\infty}_{-\infty}N(x \mid 0,\sigma^2)dx=\int^{\infty}_{-\infty}\frac{1}{(2\pi \sigma^2)^{1/2}}exp\{-\frac{x^2}{2\sigma^2}\}dx=1\]

利用积分的换元法:

\[\int^{\infty}_{-\infty}N(x \mid \mu,\sigma^2)dx=\int^{\infty}_{-\infty}\frac{1}{(2\pi \sigma^2)^{1/2}}exp\{-\frac{(x-\mu)^2}{2\sigma^2}\}d(x-\mu)\]

因此证明了$N(x \mid \mu, \sigma^2)$的归一化:

\[\int^{\infty}_{-\infty}N(x \mid \mu,\sigma^2)dx=\int^{\infty}_{-\infty}\frac{1}{(2\pi \sigma^2)^{1/2}}exp\{-\frac{y^2}{2\sigma^2}\}dy=1\]
上篇: 过拟合、正则与模型选择:以多项式曲线拟合为例 下篇: 正态分布方差推导