六西格玛 – 假设检验（2）

大家好，欢迎来到IT知识分享网。

一、假设检验基本概念

任何过程均随时处在变化之中，绝对稳定的过程是没有的，实施统计过程控制，首先必须掌握过程分布的统计特征。而对过程分布统计特征的研究，实质就是从过程分布的部分样本信息去推断过程总体的分布及其参数。

范例：袋酸的灌装容量按标准应为153.2g，生产流水线上产品不断地封装，然后装箱入库. 怎么知道这批产品净含量是否合格呢？

这里我们通常的办法是进行抽样检查，如每隔20分钟，抽查20包，得20个容量的值X1，…，X20，根据这些值来判断生产是否正常。根据样本的信息检验关于总体的某个命题是否正确，这类问题称作假设检验问题。

1、概念：事先对总体参数或分布形式作出某种假设，然后利用样本信息来判断原假设是否成立。

2、类型：参数假设检验（T检验、F检验等）；非参数假设检验（卡方检验、二项分布检验等）

3、特点：采用逻辑上的反证法，依据统计上的小概率原理

二、小概率事件案例：

在第二次世界大战中，美国曾经宣布：一个优秀的数学家的作用超过10 个师的兵力，这句话有一个非同寻常的来历。1943年以前，在大西洋的英美运输船队常常受到德国潜艇的袭击。当时，英美两国限于实力，无力增派更多的护航舰，一时间德国的潜艇战搞得盟军焦头烂额。为此，有位美国海军将领专门去请教了几位数学家，数学家们运用概率论分析后，舰队与潜艇相遇是一个随机事件。从数学角度来看这一问题，它具有一定的规律性，一定数量的船（为100艘），编队规模越小，编次就越多（为每次20艘，就要有5个编次），编次越多，与敌人相遇的概率就越大。美国海军接受了数学家的建议，命令舰队在指定的海域集合，再集体通过危险海域，然后各自驶向预定港口，结果，奇迹出现了。盟军舰队被击沉的概率由原来的25 %降为1%，大大减少了损失，保证了物资的及时供应。

1、什么是小概率？

① 概率是从0到1之间的一个数，因此小概率就应该是接近0的一个数

② 著名的英国统计家Ronald Fisher（罗纳德，费希尔）把20分之1作为标准，这也就是0.05，从此0.05或比0.05小的概率都被认为是小概率。

2、小概率事件原理：

小概率事件在一次试验中通常是不会发生的，如果在一次试验中，小概率事件竟然发生了，说明原假设有问题，从而拒绝原假设。这就是假设检验的基本思想。

三、什么是反证法？

反证法（又称背理法）是一种论证方式，它首先假设某命题不成立（即在原命题的题设下，结论不成立），然后推理出明显矛盾的结果，从而下结论说假设不成立，原命题得证。

1、反证法原理

原命题和原命题的否定是对立的存在：原命题为真，则原命题的否定为假；原命题为假，则原命题的否定为真。这一点可以从集合论的角度理解。

2、反证法范例

证明：水是脏的。假如水是干净的，水里就不会有杂质，而事实水里有杂质，说明假设不成立，所以水是脏的

三、假设检验术语

3-1、H0=零假设

①：是关于被检验问题的基本陈述。此陈述一般描述问题的现状，而且除非有可信服的样本证据证明它是错的，否则就不能拒绝H0，也称为原假设或归无假设

②：总是包含等号

3-2、Ha=备择假设

也叫对立假设、互补假设或研究假设，也记为H1，是针对零假设的对立陈述。只有存在可信服的样本证据证明它是对的时候才能接受Ha

3-3、P值=概率值

是发生的概率值

四、假设检验基本形式

假设检验基本形式

4-1、双侧假设检验

检验企业生产的零件平均长度是否为4厘米。从统计角度陈述问题μ=4。从统计角度提出相反的问题μ≠4。必需互斥和穷尽，提出原假设μ=4，提出备择假设μ≠4，有≠符号。

4-2、单侧假设检验

采用新技术生产后，将会使产品的使用寿命明显延长到1500小时以上，建立的原假设与备择假设应为，H0：μ≤1500 H1：μ＞1500

五、假设检验两类错误

H0: 无罪

假设检验就好像一场审判过程假设检验就好像一场审判过程

记住：

α是发现差别，而实际上没有差别的风险

β是没有发现差别，而实际上有差别的风险

1.第一类错误（弃真错误）

原假设为真时拒绝原假设，会产生一系列后果，第一类错误的概率为第一类错误，被称为显著性水平

2.第二类错误（取伪错误）

原假设为假时接受原假设，第二类错误的概率为第二类错误(Beta)

六、显著性水平的概念

6-1、发生第一类错误的概率通常用于检验结论的可靠性度量、假设检验中犯第一类错误的概率被称为显著性水平，记为α

6-2、1-α 为置信度或置信水平，其表明了区间估计的可靠性显著性水平

6-3、显著性水平是在进行假设检验时事先确定一个可允许的作为判断界限的小概率标准。检验中，依据显著性水平大小把概率划分为两个区间，小于给定标准的概率区间称为拒绝区间，大于这个标准则为接受区间。事件属于接受区间，原假设成立而无显著性差异；事件属于拒绝区间，拒绝原假设而认为有显著性差异

七、P值

是一个概率值，表示如果原假设H0真，所得到的样本结果会像实际观测结果那么极端或更坏的概率。是观测到的原假设为真时的概率。左侧检验时，P值为曲线上方小于等于检验统计量部分的面积。右侧检验时，P值为曲线上方大于等于检验统计量部分的面积。被称为观察到的（或实测的）显著性水平。H0能被拒绝的最小值。

八、利用P值进行决策

单侧检验：若P值＞α，不能拒绝H0

双侧检验：若P值＞α/2，不能拒绝H0

注意：α经验值为0.05或0.1

九、假设检验的步骤及原则

① 步骤

1-1 提出原假设和备择假设

1-2 确定适当的检验统计量

1-3 规定显著性水平

1-4 计算检验统计量的值

1-5 作出统计决策

十、假设检验的实际例子

10-1：比较两个班组的产量是否相同

H0 ：A组的平均值=B组的平均值

Ha ：A组的平均值≠B组的平均值

10-2：判断两个变量之间的回归关系

H0 ：此直线斜率为零

Ha ：此线斜率不为零

10-3：比较两台设备的稳定性是否一致

H0 ：设备A的方差=设备B的方差

Ha ：设备A的方差≠设备B的方差

十一、假设检验的数据类型选择

数据选型基本框架

案例：

现在有三个工厂生产同一种袋酸产品，你需要判断三个工厂生产的袋酸产品重量有无差别，现在从每一个工厂随机收集了20个样本，并且已经测量好它们的重量数据了，请问你用哪种假设检验的方法来判断其均值是否存在差异？

H0 ：三个工厂之间没有差异；Ha ：三个工厂之间有显著差异

数据

口令：统计–方差分析–单因子方差（未堆叠）

口令图

对话框数据

由图可知P=0.000，小于0.05，拒绝原假设，也即三家工厂产品重量存在差异。那么问题来了，从上图数据看，A工厂和B工厂均值均为156左右，数据上应无差异。此时如要在细分，可以对A工厂和B工厂进行方差分析。

如上述例子，我们使用的是“单因子方差分析（未堆叠）”，当然也可以通过前几篇文章所述，先使用“堆叠”工具使三家工厂的数据进行堆叠，堆叠后再选择“单因子方差分析”对话框。

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://haidsoft.com/176899.html

六西格玛 – 假设检验（2）

相关推荐

发表回复