大家好,欢迎来到IT知识分享网。
在诊断试验中,研究者希望考察不同诊断方法在诊断结果上是否具有一致性。如评价两个医务工作者对同一组病人的诊断结论的一致性、同一医务工作者对同一组病人前后进行两次观察作出诊断的一致性。1960年Cohen等提出用Kappa值作为评价判断的一致性程度的指标。实践证明,它是一个描述诊断的一致性较为理想的指标,因此在临床试验中得到广泛的应用。下文给出的例子也都是基于医疗诊断的,可见其提出背景。除此之外,kappa系数也可用于衡量分类精度,在kaggle竞赛中经常被用作评价指标,如2019 data science bowl和PetFinder.my Adoption Prediction等等。
由于诊断试验一致性的大小不完全取决于研究者的临床经验和诊断能力,还可能是由于机遇因素的作用,致使不同研究者得出相同的诊断结论。即没有受过专业医疗教育的人对患者进行诊断也可能会得出与专业医生一样的结论,而这种一致性结论完全是由于机遇因素导致的。kappa系数即是在一致性判断中剔除机遇因素的影响。kappa取值为[0,1],值越大代表一致性越强/分类精度越高。
kappa系数的计算分为以下几类,下面将通过例子介绍这几种kappa系数如何计算。
- 简单kappa(simple kappa)
- 加权kappa(weighted kappa)
- 线性加权(linear weighted kappa)
- 平方加权(quadratic weighted kappa)
Simple Kappa
simple kappa的计算公式如下:
其中,




下文给出一个计算例子:
Weighted Kappa
对于有序分类变量的一致性检验应该使用加权kappa系数。当分类类别代表等级分类,例如对疾病严重程度给出诊断,分为最轻到最重的五个等级。我们通常会认为,对同一个诊断的分级差异越大则造成的结果越严重,不一致性越强。例如将一个疾病最重的人判别为最轻和将一个疾病较轻的人判断为最轻带来的惩罚应该是不一样的。加权kappa便是基于这个思想。
线性加权(linear weighted kappa)认为每两个级别之间的差异相等,如果两个判定结果之间差三个类别,那么他们之间的不一致程度刚好是差一类的三倍,权值计算公式如下,其中i,j代表类别编号,其差值也就代表两个类别的距离。N为类别总数。由公式可知,判定结果一致时,权值为0。
平方加权(quadratic weighted kappa)则将线性加权的权值平方,放大级别距离大的判定不一致程度,权值计算公式如下:
kappa系数计算公式如下:
其中

比如计算上文例子的线性加权kappa
计算机遇判断后得到的列联表如下
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/14950.html

