统计学基础 | 置信区间,置信水平,显著性水平?

统计学基础 | 置信区间,置信水平,显著性水平?你好 见字如面 我是玫森 不管您是从事质量控制 体系审核 生产管理又或者是项目开发等 如下场景是否似曾相识 在汽车零件厂的生产车间 质检员正对着一批螺丝发愁 这批螺丝要求直径必须是 10mm 0 1mm 可质检员随机抽检了 20 个螺丝 测得平均

大家好,欢迎来到IT知识分享网。

你好,见字如面,我是玫森~

不管您是从事质量控制,体系审核,生产管理又或者是项目开发等,如下场景是否似曾相识:

在汽车零件厂的生产车间,质检员正对着一批螺丝发愁。这批螺丝要求直径必须是10mm±0.1mm,可质检员随机抽检了20个螺丝,测得平均直径9.98mm ,有人觉得生产线要马上停工整改,有人却认为抽检误差不能代表整体,到底谁说得对?

这个看似简单的争议,其实藏着统计学里至关重要的一个概念 – “置信区间”。

理解它,运用它,能帮我们从零散的抽检数据里理出头绪,避免单纯靠经验做决定的现象 。

统计学基础 | 置信区间,置信水平,显著性水平?


本章主要围绕什么是置信区间、置信区间相关的概念、手动&Minitab 计算展开分享

在“统计学基础 | 概念全面梳理, 统计学不再难”中有提到统计学两个方面的应用:

描述性统计与推理性统计。推理性统计有两种类型的推断:估计和假设检验

前言:推断性统计的核心目标- > 用样本猜总体

假设你想知道上例中所有螺丝的平均直径(总体参数),但没法测完所有螺丝,只能抽20个(样本) – 推断性统计就是用这20个样本的数据,去“猜”总体的真实情况,具体有两种“猜法”:“估计” 和 “假设检验”

第一种推断:「估计」- 直接猜总体参数是多少(分“精准猜”和“范围猜”)

1. 点估计:用一个数“精准猜”

做法:直接用样本的某个统计量(比如样本均值、样本标准差)作为总体参数的“猜测值”。

例:抽检20个螺丝,平均直径9.98mm → 猜总体平均直径就是9.98mm。

特点:简单直接,但风险大 – 万一样本抽偏了(比如刚好抽到一批偏细的螺丝),猜测值就会有误差。

2. 区间估计:用一个范围“安全猜”

做法:算出一个“有概率保障的范围”,认为总体参数大概率藏在里面(即「置信区间」)。

例:算出95%置信区间是9.95mm~10.10mm → 有95%的把握认为,总体平均直径在9.95~10.10mm之间。

特点:承认“猜不准”,但用范围和概率把误差“框住”,比点估计更稳妥(生产中常用)。

第二种推断:「假设检验」- 先“假设”再“验证”,判断猜想是否成立

做法:先假设总体参数“等于某个值”,再用样本数据检验这个假设是否合理。

例(接螺丝案例):

1. 先假设:“总体平均直径=10mm(合格)”;

2.用样本验证:算抽检的20个螺丝直径是否“离10mm太远”(比如平均9.98mm,结合标准差看是否“显著偏细”);

3.下结论:如果样本数据“离假设值太远”(超出合理误差范围),就拒绝假设(认为生产线不合格);反之,就暂时接受假设(认为生产线合格)。

关于假设检验的模块往后会分很多小模块分享,今天的分享聚焦在第一种推断:区间估计也就是”置信区间“

不仅在生产制造车间会运用到置信区间帮助做决策,在医学领域,体外诊断试剂临床试验指导原则中对于数据统计分析要求计算回归系数、截距、医学决定水平处的预期偏倚和阳性/阴性符合率的置信区间,那么置信区间是什么?为什么要计算置信区间?怎样计算置信区间?

什么是置信区间?

“置信区间”的英文是confidence interval,也译为“可信区间”、“信赖区间”或“信心区间”。“confidence interval” 这个术语跟 “logit” 类似,没有既精确又易懂的译法(translation),为了方便大家阅读,以下统称置信区间。

置信区间是指由样本统计量所构造的总体参数的估计区间。

置信区间是参数估计的一种形式,通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间用数轴上的一段距离或一个数据区间,表示总体参数的可能范围.这一段距离或数据区间称为区间估计的置信区间。

与置信区间相关的概念

  • 置信水平(Confidence level)也称为置信度:常用的置信水平有90%, 95%, 99%等,指“通过样本构造的置信区间包含总体真实参数的概率。例如,95% 的置信水平意味着,如果从总体中重复抽取大量样本并构造置信区间,大约有 95% 的区间会包含总体参数的真实值。置信度越高,我们对区间包含总体真实值的把握越大,但相应地,区间也会变宽。例如说“真实直径在0 – 100mm之间”,置信度100%,却毫无实用价值;若说“真实直径就是9.98mm”,精准却没可信度。生产中常用95%置信度,是在可信度和精准度间找到了平衡。
  • 显著性水平(significance level)是估计总体参数落在某一区间内,可能犯错误的概率为显著性水平,用α表示。(在正态分布表中,表中的数值是表示某点位置开始左侧的面积,例如x=0,面积为0.5表示小于0的概率。当显著性水平α为某一值时,表示希望正确的区间所围成的面积为1-α,此时可查α/2所对应的点,也可以差1-α/2所对应得点).
  • 什么是alpha(α)? 实际总体参数的最大风险或概率位于置信区间之外,该概率总是大于0,通常设置在5%。
  • 样本统计量:如样本均值、样本标准差、样本比例等,它是置信区间的“中心点”,是我们根据样本数据计算出的,如螺丝案例里的平均值9.98mm ,它是构造置信区间的基础;样本标准差:体现样本数据的波动程度,螺丝直径差异越大,标准差越大,说明数据越分散,反之则越集中。它反映了样本的离散特性,在计算置信区间时不可或缺。
  • 关键值:根据置信度确定,如95%置信度常用Z值1.96 (大样本时),它是“允许误差的倍数”,决定了区间在样本均值两侧延伸的幅度。
  • 置信界限(confidence limit)是对单侧置信区间中的界限以及双侧置信区间的上限(upper confidence limit,ucl)、下限(lower confidence limit,lcl)的统称。

比如:如果在一次临床试验中某评价产品的灵敏度为75%,而置信水平95%(1-0.05)的置信区间是(67%,82%),那么67%置信区间的下限,82%是置信区间的下限,显著性水平是0.05,置信水平是95%,那么产品的真实灵敏度有百分之九十五的机率落在67%和82%之间。

  • 中心极限定理起到怎样的帮助? 大家还记得中心及限定理的三个原则吗,可以回顾往期的介绍“ 统计学基础 | 中心极限定理 , 课本上的中心极限定理原来是这样的”
统计学基础 | 置信区间,置信水平,显著性水平?

置信区间计算公式与计算模拟

统计学基础 | 置信区间,置信水平,显著性水平?

正态总体均值、方差的置信区间与单侧置信限(置信水平为1-a)

公式的计算比较复杂,下面仅以一个正态总体为例,模拟置信区间的计算方式

当总体的标准差已知,或者样本量很大时,均值的置信区间的一般公式是

统计学基础 | 置信区间,置信水平,显著性水平?

1)(1-a) 被称为置信系数,该公式给出了均值 u 的置信区间.

2) Alpha 是总体均值不被包括在所计算出的区间之内的可能性.

–对于 95% 的置信区间,α 是多少?

–对于 99% 的置信区间,α 是多少?

3) 什么是 Z1-α/2?

a.)Z1-α/2是Z 值,标准正态分布曲线下的面积在该点的右侧为 α/2 .

b.)或者,距离均值μ 的在 Z1-α/2个标准差的右侧以外,曲线下的面积是α /2 .

c.)对应于常用的α 的常用的 Z1-α/2

统计学基础 | 置信区间,置信水平,显著性水平?

案例:某呼叫中心的36 名员工的随机样本,接听电话的平均数量为 379.2/周,标准差是 124. 构造该呼叫中心每名员工每周接听电话的平均数量的 95% 的置信区间.

手动计算:

统计学基础 | 置信区间,置信水平,显著性水平?

Minitab 单样本Z计算结果&方式:

统计学基础 | 置信区间,置信水平,显著性水平?

统计学基础 | 置信区间,置信水平,显著性水平?

统计学基础 | 置信区间,置信水平,显著性水平?


小样本的怎么办?

1)如果已知总体的标准差,对于小样本的情况,也采用上面的公式.

2)如果总体的标准差未知(通常是这种情况):

3)采用标准偏差的估计值 (s)

4)采用 t-分布,而不是正态 (Z) 分布

统计学基础 | 置信区间,置信水平,显著性水平?

Q: 什么是 t-分布?

t- 分布是钟形曲线(类正态分布)分布族的一种,它依赖于样本量.

样本量 n 越小,其分布越宽越扁平.

统计学基础 | 置信区间,置信水平,显著性水平?

举例:

某投资银行想知道,从他们的郊区办公室邮递客户文件到他们的市区分行的平均时间. 随机抽取十次 (10) 邮递. 该 10 次邮递具有均值为 72.6 分钟且总体标准差的样本估计值为 6.2 分钟. 构造邮递时间均值的 95% 的 CI .

手动计算:

统计学基础 | 置信区间,置信水平,显著性水平?

Minitab 单样本t 计算结果&方式:

统计学基础 | 置信区间,置信水平,显著性水平?

统计学基础 | 置信区间,置信水平,显著性水平?

该银行, 想要更准确些,收集了 100 次邮递的数据. 均值是 70.0 且标准差估计值为 8.1. 构造邮递时间均值的 95% CI .


还有关于标准差,比率的CI 计算案例,往后再继续分享~

关于计算部分,在软件工具发达的今天,不需要手动计算,建议大家观察如下两个公式,核心拆解:

置信区间=中间值(均值、标准差、比率等)+/- 误差范围

误差范围又取决于两个关键因素:置信度*样本的波动

置信度:常用的Z值/T值 用95%还是99%,概率越高,范围越宽

样本的波动程度:比如10个人身高差异大,误差范围就大

置信区间在生产现场的广泛应用

1. 质量控制:除螺丝直径,生产线上产品重量、长度、强度等关键指标都能用置信区间监控。设定合理置信区间,一旦样本数据超出范围,就可及时发现生产异常。

2. 设备性能评估:评估新设备生产稳定性,如注塑机注塑产品尺寸,计算尺寸置信区间,若区间窄且在合格范围,说明设备性能稳定。

3. 工艺改进效果判断:生产工艺改进后,对比改进前后产品质量指标置信区间,若改进后区间更窄且向目标值靠拢,说明工艺改进有效。

置信区间是生产现场的强大数据工具,能帮我们把有限样本数据转化为可靠决策依据。在面对生产中的数据难题,不妨试用置信区间来解决问题。

关于置信区间,往后会有后续,请大家继续关注,今天的分享就到这里~


全文END

点这里关注我

记得点赞 哦, 是对我努力输出最大的支持,谢谢~

2025,我们一起加油

统计学基础 | 置信区间,置信水平,显著性水平?

统计学基础 | 置信区间,置信水平,显著性水平?

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/181196.html

(0)
上一篇 2025-06-18 11:45
下一篇 2025-06-18 12:00

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信