浅谈统计检验效能和FDR

大家好，欢迎来到IT知识分享网。

最近写的文章，朋友过目后提出的问题让我自己感觉到本科阶段的学习没有做一个非常好的总结，应付完考试之后，早已忘到九霄云外，现在的我通过写博客，一点一点找回来。

什么是统计检验的效能（power）？

我们首先来回顾一下，在假设检验中，我们需要什么。

（1）原假设（ $H_{0}$ ）：可以认为是辩论赛中，保守一方的观点（e.g. 超级英雄和普通人没啥区别）
（2）备择假设（ $H_{A}/H_{1}$ ）：可以类比为辩论赛中，激进一方的观点（e.g. 超级英雄就是爷，就是比普通人牛）

在做计算的过程中，会涉及到一个非常重要的数值 —— $α$ （一般取0.05 或 0.01）

$α$ 的含义是：显著性水平、一类错误发生的概率（Type I Error）、弃真错误发生的概率。

从这里有需要再引入几个概念，如下表：

	$H_{0}$ 是正确的	$H_{0}$ 是错误的
接受 $H_{0}$	接受 $H_{0}$ （ $1 - α$ ）	$β$ 错误
拒绝 $H_{0}$	$α$ 错误	接受 $H_{1}$ （ $1 - β$ ）

β从α衍生出来，是二类错误发生的概率（Type II Error）、取伪错误发生的概率。

在假设检验过程中，我们把拒绝原假设后，接受正确的备择假设的概率称为统计检验的效能/功效（statistical power），因此其在数值上等于 $1 - β$ 。
【个人理解】 $1 - β$ ，实际上就是确定两个样本的总体有差异之后，假设检验能够顺利根据样本推断出真实的总体信息的概率。

什么是FDR（false discovery rate）？

	被测对象真实情况：阳性	被测对象真实情况：阴性
新冠检测结果：阳性	5	2
新冠检测结果：阴性	3	90

可以得到2个指标的计算结果，如下：
（1）true positve rate（sensitivity，即灵敏度）：检测出的真实阳性样本数除以所有真实阳性样本数
$\frac{5}{5+3} = 0.625$
（2）false positive rate：检测出的假阳性样本数除以所有真实阴性样本数
$\frac{2}{2+90} = 0.0217$
还有一个非常重要的计算指标，是灵敏度（specificity），计算公式如下：
$\frac{90}{90+2}= 0.9783$
一张找来的总结表：

参考资料

[1] https://www.jianshu.com/p/d5ea74ca61f8
[2] https://blog.csdn.net/fish/article/details/
[3] 统计功效, 百度百科
[4] 真阳性率, 百度百度
[5] 假阳性率, 百度百科
[6] https://zhwhong.cn/2017/04/14/ROC-AUC-Precision-Recall-analysis/

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://haidsoft.com/146720.html

浅谈统计检验效能和FDR

什么是统计检验的效能（power）？

什么是FDR（false discovery rate）？

参考资料

相关推荐

发表回复