Kappa系数简单介绍

全栈程序员-站长 • 2026年3月19日下午10:25 • 未分类 • 阅读 2

Kappa系数简单介绍kappa 系数是统计学中度量一致性的指标值在 1 1 对于评分系统一致性就是不同打分人平均的一致性对于分类问题一致性就是模型预测结果和实际分类结果是否一致 kappa 系数的计算是基于混淆矩阵取值为 1 到 1 之间通常大于 0 简单 kappa 下面的表格是真实类别和预测类别的混淆矩阵其中 aija ij aij 表示真实为 iii 预测为 jjj 的样本数量 NNN 为样本总量 ai jaij a j iaij a i sum j a ij a j

kappa系数是统计学中度量一致性的指标, 值在[-1,1]. 对于评分系统, 一致性就是不同打分人平均的一致性; 对于分类问题，一致性就是模型预测结果和实际分类结果是否一致. kappa系数的计算是基于混淆矩阵, 取值为-1到1之间, 通常大于0.

kappa值含义：

简单kappa

下面的表格是真实类别和预测类别的混淆矩阵, 其中 $a_{ij}$ 表示真实为 $i$ 预测为 $j$ 的样本数量. $N$ 为样本总量. $a_{i+}=\sum_{j} a_{ij}, \, a_{+j}=\sum_{i} a_{ij}.$

	类别1	类别2	类别3	总计
类别1	$a_{11}$	$a_{12}$	$a_{13}$	$a_{1+}$
类别2	$a_{21}$	$a_{22}$	$a_{23}$	$a_{2+}$
类别3	$a_{31}$	$a_{32}$	$a_{33}$	$a_{3+}$
总计	$a_{+1}$	$a_{+2}$	$a_{+3}$	$N$

其中, $P_o$ 为预测的准确率, 也可理解为预测的一致性, $P_o=\frac{\sum_{i=1}^{3} a_{ii} } {N}$ .
$P_e$ 表示偶然一致性, $P_e=\frac{\sum_{i=1}^{3} a_{i+}*a_{+i} } {N^2}$ .
其实, 本人以为同用频(概)率来表示, 形式更加简洁.
记 $p_{ij}=a_{ij}/ N$ , $p_{i+}=a_{i+}/ N$ , $p_{+j}=a_{+j} / N$ , 则kappa系数为
$P_o=\frac{\sum_{i=1}^{3} a_{ii} } {N}=\sum_{i=1}^{3} p_{ii},$
$P_e=\frac{\sum_{i=1}^{3} a_{i+}*a_{+i} } {N^2}=\sum_{i=1}^{3} p_{i+}*p_{+i}.$

加权Kappa

下面介绍几种常用的权重计算方法:
设得分有序为 $c_0 c0<c1<⋯<cm−1$

线性权重
$w_{ij}=1-\frac{|i-j|}{m-1},$
二次权重
$w_{ij}=1-(\frac{i-j}{m-1})^2.$

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/203175.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

HTML网页设计结课作业榆林子州 HTML5响应式旅游景区网站模板

上一篇 2026年3月19日下午10:25

微信小程序中globalData的设置与读写

下一篇 2026年3月19日下午10:25

linux ftrace的原理和实现_bytes≤buffersize

linux ftrace的原理和实现_bytes≤buffersize1、简介ringbuffer是trace框架的一个基础，所有的trace原始数据都是通过ringbuffer记录的。ringbuffer的作用主要有几个：1、存储在内存中，速度非常快，对系统性能的影响降到了最低；2、ring结构，循环写。可以很安全的使用又不浪费内存，能够get到最新的trace信息；但是，难点并不在这。真正的难点是系统会在常规上下文、中断(NMI、IRQ、SOF…

全栈程序员-站长
2025年10月24日
5
openclaw

别瞎折腾了！4 步排查法，手把手教你搞定 OpenClaw Skills 各种安装报错

别瞎折腾了！4 步排查法，手把手教你搞定 OpenClaw Skills 各种安装报错

全栈程序员-站长
2026年3月12日
2
SD卡 MMC卡 MS卡 TF卡

SD卡 MMC卡 MS卡 TF卡SD卡（SecureDigitalMemoryCard）中文翻译为安全数码卡，是一种基于半导体快闪记忆器的新一代记忆设备。SD卡由日本松下、东芝及美国SanDisk公司于1999年8月共同开发研制。SD卡在24mm×32mm×2.1mm的体积内结合了SanDisk快闪记忆卡控制与MLC（MultilevelCell）技术和Toshiba（东芝）0.16u及0.13u的NAND技术，通过9针…

全栈程序员-站长
2022年5月29日
83
黑盒和白盒测试方法详解

黑盒和白盒测试方法详解1 黑盒测试黑盒测试也称功能测试测试中把被测的软件当成一个黑盒子不关心盒子的内部结构是什么只关心软件的输入数据与输出数据黑盒测试的方法有 7 个分别是基于需求的设计方法等价类划分边界值因果图正交矩阵法场景设计法错误推测法黑盒测试方法详见 https blog csdn net asdx1020 article details

全栈程序员-站长
2026年3月16日
2
关于 Sensor flicker/banding现象的解释「建议收藏」

关于 Sensor flicker/banding现象的解释「建议收藏」目录1、基本概念2、30fps，1帧内banding过程演示3、30fps，帧与帧之间banding过程演示4、25fps，帧与帧之间banding过程演示5、总结flicker交流电网中的传输的能量并不是稳定不变的，而是随着一个固定频率变化的，这个频率一般被称为工频，例如中国是50Hz，美国是60Hz。工频由电力系统决定。工频的带来的这种能量变化称为flicker。下面以50HZ为例进行解释，交流电以1/50s，即20ms的周期进行变化，其变化规律如图所示：而对于能量来说，并没有正负之分，因此能量

全栈程序员-站长
2022年10月13日
3
float强转int

float强转int本文只讨论 float 转 int 的原理如有不当之处欢迎留言指出交流学习推荐阅读关于 float 转 int 的函数实现非结构体实现版类型强转丢失精度的根源目录一思路 1 1 十进制 1 2 二进制 1 3 处理棘手的符号位 1 4 小端模式二 C 语言实现 2 1 思路 2 2 利用结构体实现 2 3 利用内存拷贝函数 memcpy 实现一思路 1 1 十

全栈程序员-站长
2026年3月18日
0

发表回复

关注全栈程序员社区公众号