大家好,欢迎来到IT知识分享网。
作者 | Long Luo
来源 | 好奇的程序员
) [^1] 这个词,六西格玛是指生产的产品中,
的产品是没有质量问题的,即只有
的不良率。
,允许的标准差是
。根据
原则,零件规格允许的偏差范围是:
。
或低于
的概率是非常低的,约为
。如果工厂每天生产 100 万个零件,只允许有
个零件会超出
的范围,几乎可以忽略不计。因此,生产过程是极其稳定和可靠的,达到了六西格玛水平。
中
的不良率来自哪里呢?
) [^2] 中,
的数据位于平均值的一个标准差内,
位于两个标准差内,
位于三个标准差内,这也是著名的 68-95-99.7 Rule [^3] ,如下图 1 所示:

什么是正态分布?




),是一种重要的概率分布,是由数学王子高斯 [^4] 在 19 世纪初提出的。有很多日常现象都符合这种分布,如人的身高、考试成绩等。正因为它几乎无处不在,所以叫 Normal Distribution 。德国曾经发行的一款 10 马克的纸币上就印着高斯和正态分布曲线,如下图 6 所示。

是正态分布的数学期望值,可解释为位置参数,决定了分布的位置,表示曲线中心在哪里;方差
为尺度参数,决定了分布的幅度,表示曲线的扁平情况。均值
和方差
不同,曲线形状也有所不同,如下图 7 所示:

、
、
、
,组合起来非常复杂。在学习时,课本介绍正态分布时就直接给出这个公式,却从来不说明这个概率密度函数是怎么推导来的,来龙去脉是什么。最近看了 3Blue1Brown 关于 概率论的系列视频 ,我知道了正态分布曲线公式为什么是这样,我们将在下一章节中推导出这个公式。
正态分布公式怎么来的?
轴和
轴。每次投掷飞镖都会受到随机因素而偏离目标,故每次飞镖在镖盘的落点
是
维随机变量。

个条件:
轴和
轴坐标是相互独立的;
3Blue1Brown Herschel 推导方法
如下图 9 所示,设箭头所示落点区域
的概率密度函数为
,
表示有
个输入参数,落点的坐标
和
。

我们知道每个落点区域
的概率密度,可以表示为
轴方向上概率密度函数与
轴方向上概率密度函数的乘积,每个方向上的概率密度函数只有对应方向上一个参数。
轴方向上概率密度函数为
,
轴方向上概率密度函数为
,则有以下公式:
我们知道可以通过旋转对称性,可知
轴和
轴方向上概率密度函数相同,所以
。同时落点
距离原点的距离为
,如下图 10 所示:

概率密度函数表示为半径(距原点的距离)的单变量函数
,则有:
综合上述 2 个公式可得:
轴上距离原点距离为
的点
,坐标为
,如下图 11 所示:

轴
处
处的概率密度函数可以写成:
等于
乘以某个常数
,所以
,其中
为某个常数。
,则公式可以写成:
。上述公式是一个函数方程 [^6] ,熟悉函数方程的同学可能一眼就知道满足上述公式的函数解是指数函数 [^7] 。
,则有
,那么上述函数方程公式可以写成:
个正整数,先相加再代入函数
,结果等于先分别代入函数
再相乘。这意味着,函数
把加法变成了乘法。
个正整数,那么很容易扩展至任意
个正整数:
不妨代入
,则有:
这里
可以为任意整数
,则有:
不妨令
,同时上述公式可以推广至实数域
,则有:
为了方便和统一,任意指数函数都可以写成以
为底的指数函数:
至此我们就求出了满足函数方程 6 函数
为:
那么常数
是多少呢?根据概率论我们知道:
上式就是大名鼎鼎的高斯积分(
) [^8] ,如何求解高斯积分网上有很多教程,这里不再赘述。
最终我们得出了
维情况下的未归一化的概率密度函数:
更严谨的数学分析法
轴和
轴具有相同且连续的概率密度函数。
的概率密度函数为
,
轴方向上概率密度函数为
,则
轴方向上的概率密度函数为
,那么考虑如下图 12 所示的一个充分小的黄色区域
:

飞镖落在黄色区域
的概率为:
将等式左边转换为极坐标形式,
在极坐标下的概率密度函数设为
, 则有:
由条件
,
具有旋转对称性,也就是和
无关,所以
对上述公式两边对
求导,可得:
利用链式法则,有:
上式移项可得:
我们则有:
对上式进行积分,可得:
求解上式可得:
则求得函数
为:
同理
为:
由概率论我们知道
,同时
,则:
考虑
维正态分布,并使用极坐标,则有:
令
,则有:
可得:
所以可求得:
至此,我们只剩下一个未知参数
就得到所求公式。
考虑方差
定义,对于期望
,则有:
令
,
,则有:
根据分部积分公式:
则对上述公式进行分部积分求解可得:
所以我们求得
为:
即:
将求得
和
代入公式 ,最终我们求得概率密度函数为:
上述公式是期望
的特殊情况,当期望
时,更一般的公式为:
特别地,当
且
,这个分布被称为标准正态分布:
正态分布公式的几何意义
给出的优雅直观方法,仅仅依靠那
个假设条件,我们居然最终求出了正态分布的公式。有没有感觉到数学的美感?
意味着空间上的对称性,即点分布距离中心是对称的。而
的出现意味着取了时间上的极限,而这和中心极限定理(
) [^9] 有关,我会在下一篇文章详细解释,敬请期待!
参考文献
[^1]: 六西格玛 https://en.wikipedia.org/wiki/Six_Sigma
[^2]: 正态分布 Normal distribution https://en.wikipedia.org/wiki/Normal_distribution
[^3]: 68-95-99.7 法则 https://en.wikipedia.org/wiki/68%E2%80%9395%E2%80%9399.7_rule
[^4]: 高斯 Gauss https://en.wikipedia.org/wiki/Carl_Friedrich_Gauss
[^5]: 天文学家赫歇尔 John Herschel https://en.wikipedia.org/wiki/John_Herschel
[^6]: 函数方程 https://en.wikipedia.org/wiki/Functional_equation
[^7]: 指数函数 Exponential function https://en.wikipedia.org/wiki/Exponential_function
[^8]: 高斯积分 Gaussian integral https://en.wikipedia.org/wiki/Gaussian_integral
[^9]: 中心极限定理 Central limit theorem https://en.wikipedia.org/wiki/Central_limit_theorem
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/170469.html