Kappa系数简单介绍

Kappa系数简单介绍kappa 系数是统计学中度量一致性的指标 值在 1 1 对于评分系统 一致性就是不同打分人平均的一致性 对于分类问题 一致性就是模型预测结果和实际分类结果是否一致 kappa 系数的计算是基于混淆矩阵 取值为 1 到 1 之间 通常大于 0 简单 kappa 下面的表格是真实类别和预测类别的混淆矩阵 其中 aija ij aij 表示真实为 iii 预测为 jjj 的样本数量 NNN 为样本总量 ai jaij a j iaij a i sum j a ij a j

kappa系数是统计学中度量一致性的指标, 值在[-1,1]. 对于评分系统, 一致性就是不同打分人平均的一致性; 对于分类问题,一致性就是模型预测结果和实际分类结果是否一致. kappa系数的计算是基于混淆矩阵, 取值为-1到1之间, 通常大于0.

kappa值含义:

简单kappa

下面的表格是真实类别和预测类别的混淆矩阵, 其中 a i j a_{ij} aij表示真实为 i i i预测为 j j j的样本数量. N N N为样本总量. a i + = ∑ j a i j ,   a + j = ∑ i a i j . a_{i+}=\sum_{j} a_{ij}, \, a_{+j}=\sum_{i} a_{ij}. ai+=jaij,a+j=iaij.

类别1 类别2 类别3 总计
类别1 a 11 a_{11} a11 a 12 a_{12} a12 a 13 a_{13} a13 a 1 + a_{1+} a1+
类别2 a 21 a_{21} a21 a 22 a_{22} a22 a 23 a_{23} a23 a 2 + a_{2+} a2+
类别3 a 31 a_{31} a31 a 32 a_{32} a32 a 33 a_{33} a33 a 3 + a_{3+} a3+
总计 a + 1 a_{+1} a+1 a + 2 a_{+2} a+2 a + 3 a_{+3} a+3 N N N

其中, P o P_o Po为预测的准确率, 也可理解为预测的一致性, P o = ∑ i = 1 3 a i i N P_o=\frac{\sum_{i=1}^{3} a_{ii} } {N} Po=Ni=13aii.
P e P_e Pe表示偶然一致性, P e = ∑ i = 1 3 a i + ∗ a + i N 2 P_e=\frac{\sum_{i=1}^{3} a_{i+}*a_{+i} } {N^2} Pe=N2i=13ai+a+i.
其实, 本人以为同用频(概)率来表示, 形式更加简洁.
p i j = a i j / N p_{ij}=a_{ij}/ N pij=aij/N, p i + = a i + / N p_{i+}=a_{i+}/ N pi+=ai+/N, p + j = a + j / N p_{+j}=a_{+j} / N p+j=a+j/N, 则kappa系数为
P o = ∑ i = 1 3 a i i N = ∑ i = 1 3 p i i , P_o=\frac{\sum_{i=1}^{3} a_{ii} } {N}=\sum_{i=1}^{3} p_{ii}, Po=Ni=13aii=i=13pii,
P e = ∑ i = 1 3 a i + ∗ a + i N 2 = ∑ i = 1 3 p i + ∗ p + i . P_e=\frac{\sum_{i=1}^{3} a_{i+}*a_{+i} } {N^2}=\sum_{i=1}^{3} p_{i+}*p_{+i}. Pe=N2i=13ai+a+i=i=13pi+p+i.




加权Kappa

下面介绍几种常用的权重计算方法:
设得分有序为 c 0 < c 1 < ⋯ < c m − 1 c_0
c0<c1<<cm1
, 取值为 c i = i c_i=i ci=i.

  • 线性权重
    w i j = 1 − ∣ i − j ∣ m − 1 , w_{ij}=1-\frac{|i-j|}{m-1}, wij=1m1ij,
  • 二次权重
    w i j = 1 − ( i − j m − 1 ) 2 . w_{ij}=1-(\frac{i-j}{m-1})^2. wij=1(m1ij)2.
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/203175.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月19日 下午10:25
下一篇 2026年3月19日 下午10:25


相关推荐

  • linux ftrace的原理和实现_bytes≤buffersize

    linux ftrace的原理和实现_bytes≤buffersize1、简介ringbuffer是trace框架的一个基础,所有的trace原始数据都是通过ringbuffer记录的。ringbuffer的作用主要有几个:1、存储在内存中,速度非常快,对系统性能的影响降到了最低;2、ring结构,循环写。可以很安全的使用又不浪费内存,能够get到最新的trace信息;但是,难点并不在这。真正的难点是系统会在常规上下文、中断(NMI、IRQ、SOF…

    2025年10月24日
    5
  • 别瞎折腾了!4 步排查法,手把手教你搞定 OpenClaw Skills 各种安装报错

    别瞎折腾了!4 步排查法,手把手教你搞定 OpenClaw Skills 各种安装报错

    2026年3月12日
    2
  • SD卡 MMC卡 MS卡 TF卡

    SD卡 MMC卡 MS卡 TF卡SD卡(SecureDigitalMemoryCard)中文翻译为安全数码卡,是一种基于半导体快闪记忆器的新一代记忆设备。SD卡由日本松下、东芝及美国SanDisk公司于1999年8月共同开发研制。SD卡在24mm×32mm×2.1mm的体积内结合了SanDisk快闪记忆卡控制与MLC(MultilevelCell)技术和Toshiba(东芝)0.16u及0.13u的NAND技术,通过9针…

    2022年5月29日
    83
  • 黑盒和白盒测试方法详解

    黑盒和白盒测试方法详解1 黑盒测试黑盒测试也称功能测试 测试中把被测的软件当成一个黑盒子 不关心盒子的内部结构是什么 只关心软件的输入数据与输出数据 黑盒测试的方法有 7 个 分别是 基于需求的设计方法 等价类划分 边界值 因果图 正交矩阵法 场景设计法 错误推测法黑盒测试方法 详见 https blog csdn net asdx1020 article details

    2026年3月16日
    2
  • 关于 Sensor flicker/banding现象的解释「建议收藏」

    关于 Sensor flicker/banding现象的解释「建议收藏」目录1、基本概念2、30fps,1帧内banding过程演示3、30fps,帧与帧之间banding过程演示4、25fps,帧与帧之间banding过程演示5、总结flicker交流电网中的传输的能量并不是稳定不变的,而是随着一个固定频率变化的,这个频率一般被称为工频,例如中国是50Hz,美国是60Hz。工频由电力系统决定。工频的带来的这种能量变化称为flicker。下面以50HZ为例进行解释,交流电以1/50s,即20ms的周期进行变化,其变化规律如图所示:而对于能量来说,并没有正负之分,因此能量

    2022年10月13日
    3
  • float强转int

    float强转int本文只讨论 float 转 int 的原理 如有不当之处 欢迎留言指出 交流学习 推荐阅读关于 float 转 int 的函数实现 非结构体实现版 类型强转丢失精度的根源目录一 思路 1 1 十进制 1 2 二进制 1 3 处理棘手的符号位 1 4 小端模式二 C 语言实现 2 1 思路 2 2 利用结构体实现 2 3 利用内存拷贝函数 memcpy 实现一 思路 1 1 十

    2026年3月18日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号