对AUC计算公式和几何意义的理解

对AUC的一些理解1.

要想理解AUC，得从混淆矩阵说起。

混淆矩阵

对于一个二分类问题，每个样例有自己的真实类别和模型给出的预测类别，真实类别和预测类别都分别有两种，定义标记为1的为正例，标记为0的为反例，当我们在测试集上使用模型分类时，会有以下四种情况。

	标记为正例	标记为反例
实际为正例	真正例(True-Positive)	假反例(False-Negative)
实际为反例	假正例(False-Positive)	真反例(True-Negative)

下面我们用TP、FN、FP、TN分别表示四种结果的样本个数。

分类

在一个二分类问题中，往往我们的预测输出是一个0-1之间的数字，为了得到新的样本的类别，我们需要选择一个阈值来将这些预测结果进行分类，假设 $x_k$ 是待分类的样本， $f(x)$ 是模型对 $x$ 的预测值， $h(x)$ 通过一个阈值（这里以0.5为例）将 $x$ 区分为正例或反例。

{\hat{y}}_{k} = f (x_{k})

$\hat{y}_k = f(x_k)$

h(xk)={ 1,0,if ŷ k>=0.5if ŷ k<0.5  h ( x k ) = { 1 , if  y ^ k >= 0.5 0 , if  y ^ k < 0.5

$h(x_{k}) = \begin{cases} 1, & \text{if $\hat{y}_k >=0.5$} \\[2ex] 0, & \text{if $\hat{y}_k\lt0.5$ } \end{cases}$

ROC曲线

基本概念

当我们有了混淆矩阵的概念以及对测试集上样本分类的概念之后，我们就可以绘制ROC曲线，在测试集上，我们使用模型对测试集样本进行预测后，在某个阈值下进行分类得到TP、FN、FP、TN，计算真正例率 $TPR$ (True Positive Rate)和假正例率 $FPR$ (False Positive Rate)

T P R = T P T P + F N

$TPR = \dfrac{TP}{TP+FN}$

F P R = F P T N + F P

$FPR = \dfrac{FP}{TN+FP}$

$TPR$ 的直观理解就是在所有正例中被模型预测为正例的样本所占比率， $FPR$ 就是在所有反例中被模型误判为正例的样本所占比率，例如在所有10个正例样本，4个被判定为正例，6个被判定为反例，于是有4个真正例，则 $TPR=0.4$ ，在所有10个反例样本中，3个被判断为正例，7个被判断为反例，于是有3个假反例，则 $FPR=0.3$ 。如果你知道召回率（Recall）的话，其实 $TPR$ 就是召回率。注意到二者的分母对于同一个样本集是一个定值，分别是样本中真实标记为正例和真实标记为反例的个数。
现在，针对不同的阈值 $k$ ，我们都有一个点 $(FPR_k,TPR_k)$ ，于是以 $FPR$ 为横坐标， $TPR$ 为纵坐标，将所有的点画在坐标系上，我们就能得到ROC曲线。

ROC曲线的绘制

在绘制ROC曲线的时候，我们当然不会遍历所有的实数阈值 $k$ （事实上这也不可能），下面在有限样例的情况下绘制ROC曲线的实例，以样例数 $m=10$ 为例，10个样例的预测结果和真实类别如下。

样例	$x_1$	$x_2$	$x_3$	$x_4$	$x_5$	$x_6$	$x_7$	$x_8$	$x_9$	$x_{10}$
预测结果	0.06	0.47	0.50	0.94	0.83	0.90	0.73	0.07	0.50	0.27
真实类别	1	1	1	0	1	0	0	0	1	1

举个例子，如果阈值 $k=0.5$ ，则混淆矩阵为

	标记为正例	标记为反例
实际为正例	3	3
实际为反例	3	1

假设我们设置 $k$ 从1开始，从大到小搜索 $k$ 的值，我们发现，当我们取 $k\in [0.08,0.26]$ 时，混淆矩阵对于这个区间上的所有 $k$ 是一样的，因为没有改变任何样本的预测类别，这是因为没有样本的预测结果在 $[0.08,0.26]$ 中。进而我们发现，只要我们 $k$ 的变化没有使它从大于某个预测值到小于某个预测值时，我们的分类结果都不会发生改变，因此， $k$ 只需要从大到小地遍历所有的预测值，就可以得到ROC曲线上的所有点了。
有一个问题是，为什么要从大到小遍历，不可以随机地在所有样本中取k吗？其实，从大到小遍历是为了作图的方便，也是一种作图的规定。下面我们就能看到。
为了从大到小遍历 $k$ ，将样本按照预测值从大到小排序，重新编号（因为编号不影响结果），得到

样例 $x_1$ $x_2$ $x_3$ $x_4$ $x_5$ $x_6$ $x_7$ $x_8$ $x_9$ $x_{10}$ 预测结果 0.94 0.90 0.83 0.73 0.50 0.50 0.47 0.27 0.07 0.06 真实类别 0 0 1 0 1 1 1 1 0 1

记正样本个数为 $m^+$ ，负样本个数为 $m^-$ ，取 $k=1$ ，此时所有样例都被分为反例，因此真正例和假正例的比率均为0，对应原点 $(0,0)$ ，接下来，根据上表的预测结果，从左到右依次取 $k=0.94,0.90,0.83....$ ，过程等同于逐个地将样本判断为正例（ $k=0.94$ 时， $x_1$ 就是正例，其余都是反例， $k=0.90$ 时， $x_1,x_2$ 是正例，其余是反例，以此类推），若前一个标记点是 $(x,y)$ ，若下一个加入到正例中的样本真实类别是正例，说明我们多了一个 $TP$ ，回顾真正例率的计算公式，正例样本不变，多了一个正例，则正例率相应提高 $\dfrac{1}{m^+}$ ，对应标记点为 $(x,y+\dfrac{1}{m^{+}})$ ，若下一个加入到正例中的样本真实类别是反例，则多了一个 $FP$ ，假反利率相应提高 $\dfrac{1}{m^-}$ ，则对应标记点为 $(x+\dfrac{1}{m^-},y)$ ，然后用线段连接相应的点即可得到ROC曲线。（在这里我强烈建议读者能自己在草稿纸上尝试着画一下，以便后续的理解）

图中蓝色的线条就是我们得到的ROC曲线，线上的每个点对应的 $k$ 的一个取值下的 $TPR$ 和 $FPR$ ，曲线从 $(0,0)$ 开始（ $k=1$ ，所有样本都被标记为反例， $TPR$ 和 $FPR$ 都是0），到 $(1,1)$ 结束（ $k=0$ ，所有样本都被标记为正例， $TPR$ 和 $FPR$ 都是1），图中红色的线条表示通过瞎猜分类得到的ROC曲线。

AUC
$A U C = 1 - 1 m + m - \sum x + \in D + \sum x - \in D - (W (f (x +) < f (x -)) + 1 2 W (f (x +) = f (x -)))$
$AUC = 1 - \dfrac{1}{m^+m^-}\sum_{x^+\in D^+}\sum_{x^-\in D^-}\Bigl( W\bigl(f(x^+) <f(x^-)\bigr)+\dfrac{1}{2}W\bigl(f(x^+)=f(x^-)\bigr)\Bigr) <="" script=""> 这是周志华老师《机器学习》上的公式，其中 D+ D + <script type="math/tex" id="MathJax-Element-177">D^+$ 为所有正例组成的集合， $x^+$ 是其中的一个正例， $D^-$ 为所有反例组成的集合， $x^-$ 是其中的一个反例， $f(x)$ 是模型对样本 $x$ 的预测结果，在0-1之间， $W(x)$ 仅在 $x$ 为真时取1，否则取0。
右边被减数表示任取一对正反例，正例的预测值小于反例的预测值的正反例对数，以及满足正例的预测值等于反例预测值的正反例对数的一半。我觉得这个公式和AUC的几何意义相差太大，因此，要想办法从这个公式中找到AUC的几何意义。
实际上，

$\sum_{x^{+} \in D^{+}} \sum_{x^{-} \in D^{-}} (W (f (x^{+}) < f (x^{-})) + W (f (x^{+}) = f (x^{-})) + W (f (x^{+}) > f (x^{-}))) = \sum_{x^{+} \in D^{+}} \sum_{x^{-} \in D^{-}} 1 = m^{+} m^{-}$
$\sum_{x^+\in D^+}\sum_{x^-\in D^-}\Bigl( W\bigl(f(x^+) <f(x^-)\bigr)+W\bigl(f(x^+)=f(x^-)\bigr)+W\bigl(f(x^+)> f(x^-)\bigr)\Bigr)\\=\sum_{x^+\in D^+}\sum_{x^-\in D^-}1=m^+m^- </f(x^-)\bigr)+W\bigl(f(x^+)=f(x^-)\bigr)+W\bigl(f(x^+)>$

第一个等号成立是因为三个 $W$ 有且仅有一个为1（不是大于就是小于就是等于，只有其一满足）
则

$A U C = \frac{1}{m^{+} m^{-}} \sum_{x^{+} \in D^{+}} \sum_{x^{-} \in D^{-}} (W (f (x^{+}) > f (x^{-})) + \frac{1}{2} W (f (x^{+}) = f (x^{-})))$
$AUC = \dfrac{1}{m^+m^-}\sum_{x^+\in D^+}\sum_{x^-\in D^-}\Bigl( W\bigl(f(x^+)>f(x^-)\bigr)+\dfrac{1}{2}W\bigl(f(x^+)=f(x^-)\bigr)\Bigr)$

问题简化

为了方便我们建立公式定义和图像定义之间对应的Intuition，我们先假设不存在正反例对使得

$f (x +) = f (x -)$
$f(x^+)=f(x^-)$
成立，从而

$A U C = 1 m + m - \sum x + \in D + \sum x - \in D - (W (f (x +) > f (x -)))$
$AUC = \dfrac{1}{m^+m^-}\sum_{x^+\in D^+}\sum_{x^-\in D^-}\Bigl( W\bigl(f(x^+)>f(x^-)\bigr)\Bigr)$
现在我们要结合之前画ROC曲线的步骤，令

$g (t) = 当我们将第 t 个反例加入到判定为正例的集合中时，之前一共加入的样例数$
$g(t)=当我们将第t个反例加入到判定为正例的集合中时，之前一共加入的样例数$
这个定义稍先复杂，但是其实含义十分简单，比如我依次将正例、反例、反例、正例……加入到初始为空的正例集合中时，先加入正例，再加入反例，注意这是我们加入的第一个反例，但是却是我们加入的第二个样例，因此 $g(1)=2$ ，继续下去，加入反例，注意这是我们加入的第二个反例，却是我们加入的得3个样例，因此 $g(2)=3$ ，再加入正例……为什么要定义这样的一个奇怪的函数？再次看到我们之前画的ROC图，

为了求ROC曲线和x轴围城的面积，我们将目标区域沿着x轴划分为一个个宽为 $\dfrac{1}{m^-}$ 的矩形，注意到 $\dfrac{1}{m^-}$ 是我们在作图中在得到的下一个样例是反例时，横坐标 $x$ 向右移动的步长，划分后的矩形如图所示，因为 $TPR$ 在 $[0,0.5]$ 上恒为0，因此这部分的矩形的面积是0，这个时候我们确定了矩形的宽， 那么矩形的长呢？
通过思考矩形的生成过程，我们可以知道，横坐标 $x$ 每向右移动一次会生成一个矩形，而横坐标 $x$ 向右移动 $\dfrac{1}{m^-}$ ，当且仅当我们下一个样例是反例，因此，第 $t$ 个矩形是我们取到的第 $t$ 个反例时，横坐标向右移动形成的。此时，根据 $g$ 的定义，我们恰好取到了 $g(t)-t$ 个正样例，因此对应的纵坐标就是 $\dfrac{g(t)-t}{m^+}$ ，从而ROC与x轴围城的面积是

$A U C = \sum t = 1 m - 1 m - g ( t ) - t m + = 1 m + m - \sum t = 1 m - (g (t) - t)$
$AUC = \sum_{t=1}^{m^-}\dfrac{1}{m^-}\dfrac{g(t)-t}{m^+}=\dfrac{1}{m^+m^-}\sum_{t=1}^{m^-}(g(t)-t)$

因为这一共有 $g(t)-t$ 个正例在第t个反例之前取到，因此这 $g(t)-t$ 个正例的预测值均大于第t个反例的预测值，也即

$g (t) - t = \sum x + \in D + (W (f (x +) > f (x t)))$
$g(t)-t=\sum_{x^+\in D^+}\Bigl( W\bigl(f(x^+)>f(x_t)\bigr)\Bigr)$

代入，得

$A U C = 1 m + m - \sum x + \in D + \sum t = 1 m - (W (f (x +) > f (x t)))$
$AUC = \dfrac{1}{m^+m^-}\sum_{x^+\in D^+}\sum_{t=1}^{m^-}\Bigl( W\bigl(f(x^+)>f(x_t)\bigr)\Bigr)$

用面积定义计算出的结果和之前的公式一致。

原问题

$A U C = 1 m + m - \sum x + \in D + \sum x - \in D - (W (f (x +) > f (x -)) + 1 2 W (f (x +) = f (x -)))$
$AUC = \dfrac{1}{m^+m^-}\sum_{x^+\in D^+}\sum_{x^-\in D^-}\Bigl( W\bigl(f(x^+)>f(x^-)\bigr)+\dfrac{1}{2}W\bigl(f(x^+)=f(x^-)\bigr)\Bigr)$

当存在 $x^+$ 和 $x^-$ 满足 $f(x^+)=f(x^-)$ 时，回到我们画ROC图的步骤，记得在画图之前，我们需要对样例进行排序吗，如果存在 $f(x^+)=f(x^-)$ ，我们该把哪个排在前面呢？
我们来考虑一个新的样本集合，其中存在一对 $(x^+,x^-)$ ，满足 $f(x^+)=f(x^-)$ ，一种排序方法如下

样例 $x_1$ $x_2$ $x_3$ $x_4$ $x_5$ $x_6$ $x_7$ $x_8$ $x_9$ $x_{10}$

预测结果 0.94 0.90 0.83 0.73 0.50 0.50 0.47 0.27 0.07 0.06

真实类别 0 0 1 0 1 0 1 1 0 1

样例 $x_1$ $x_2$ $x_3$ $x_4$ $x_5$ $x_6$ $x_7$ $x_8$ $x_9$ $x_{10}$

预测结果 0.94 0.90 0.83 0.73 0.50 0.50 0.47 0.27 0.07 0.06

真实类别 0 0 1 0 0 1 1 1 0 1

本文主要参考周志华老师的《机器学习》. ↩

luputo

关注
 关注

11
点赞

踩

24
收藏

打赏

9
评论

对AUC计算公式和几何意义的理解

关于AUC的一些理解1.AUC（Area Under ROC Curve）是对机器学习模型的一种性能度量，其直观的意义是ROC（Receiver Operating Characteristic）围成的面积，然而很多文章对AUC的计算公式与其直观意义“面积”的对应描述不甚明了，于是我花了一些时间研究了AUC的计算公式和几何意义，全是我个人理解，如有不对，还望指出。本文代码在 https:...

复制链接
CSDN APP

扫一扫

AUC计算方法总结

pzy20062141的专栏
09-24
12万+

1. 最直观
的，根据
AUC这个名称，我们知道，计算出
ROC曲线下面
的面积，就是
AUC
的值。事实上，这也是在早期 Machine Learning文献中常见
的
AUC计算方法。由于我们
的测试样本是有限
的。我们得到
的
AUC曲线必然是一个阶梯状
的。因此，计算
的
AUC也就是这些阶梯下面
的面积之
和。这样，我们先把score排序(假设score越大，此样本属于正类
的概率越大)，然后一边扫描就可以得到我们想要

2.
AUC
的四种计算方法

qz的博客
10-05
3116

1. 定义法 POC曲线横轴为FPR：假正例率，纵轴为TPR：真正例率。
AUC其实就是
ROC曲线下
的面积： m为总样本个数 2. 排序损失法形式化
的看，
AUC考虑
的是样本预测
的排序质量，因此与排序误差有紧密联系。给定 m+ 个正例
和m-个反例，令D+
和D-分别表示正、反例集合，则排序损失定义为：解释：排序是按照样本被预测成正例
的概率由大到小降序排列。理想中
的预测是正例都排在反例
的前面。但是不一定会是理想
的，有可能出现了损失：有
的反例出现在了正例
的前面，但是要怎样计算这种损失呢？遍历每一个反例

评论 9
您还未登录，请先
登录
后发表或查看评论

AUC
的两种计算方式

最新发布

凝眸伏笔的博客
08-02
304

推荐搜索场景下
的
auc
理解_凝眸伏笔
的博客-CSDN博客_搜索
auc随机抽出一
对样本（一个正样本，一个负样本），然后用训练得到
的分类器来
对这两个样本进行预测，预测得到正样本
的概率大于负样本概率
的概率。TPRate
的
意义是所有真实类别为1
的样本中，预测类别为1
的比例。：真正率FPRate
的
意义是所有真实类别为0
的样本中，预测类别为1
的比例。：假正率
AUC
的优势:
AUC
的计算方法同时考虑了分类器
对于正例
和负例
的分类能力，在样本不平衡
的情况下，依然能够
对分类器作出合理
的评价。...

机器学习评价指标
AUC
计算公式

_36767053的博客
06-29
2310

1.什么是
AUC？
AUC（are under curve)是一个模型
的评价指标，用于分类任务。那么这个指标代表什么呢？这个指标想表达
的含义，简单来说其实就是随机抽出一
对样本（一个正样本，一个负样本），然后用训练得到
的分类器来
对这两个样本进行预测，预测得到正样本
的概率大于负样本概率
的概率。 2.如何计算
AUC？方法一在有M个正样本,N个负样本
的数据集里。一共有MN
对样本（一
对样本即，一个正样本与一个负样本）。统计这MN
对样本里，正样本
的预测概率大于负样本
的预测概率
的个数。这里第一个条件应该为P

auc计算

weixin_42307036的博客
01-05
797

参考链接单个用户
的样本全是正样本或者全是负样本，
auc就算不出来了，所以算g
auc
的时候要过滤这两类
的case

auc是怎么计算
的？

ustbbsy的博客
06-29
7404

1
roc曲线计算
auc 我们都知道
auc是
roc曲线下
的面积，但这种计算不方便 2 公式计算
auc 有另外一种计算方法：任意给一个正类样本
和一个负类样本，正类样本
的score大于负类样本
的score
的概率公式如下 M 是正样本
的个数，N是副样本
的个数值得是第i个样本
的序号。
对所有
的预测样本
的score进行从小到大
的排序，然后从1进行标号。原始样本模型打分 0.8 0.5 0.6 0.3 0.4.

模型评价(一)
AUC大法

weixin_34148340的博客
07-29
1559

问题：
AUC是什么
AUC能拿来干什么
AUC如何求解（深入
理解
AUC）
AUC是什么
混淆矩阵(Confusion matrix)
混淆矩阵是
理解大多数评价指标
的基础，毫无疑问也是
理解
AUC
的基础。丰富
的资料介绍着
混淆矩阵
的概念，这里用一个经典图来解释
混淆矩阵是什么。显然，
混淆矩阵包含四部分
的信息： True negative(...

auc
计算公式
的
理解

ustbbsy的博客
03-22
2395

对于
auc
的计算参考 https://blog.csdn.net/_22238533/article/details/78666436 https://www.zhihu.com/question/39840928?from=profile_question_card M是正样本
的个数，N是负样本
的个数如何
理解分子，下面是我个人
的
理解。、总体原则：负样本数 = 样本总数 - ...

形象
理解
AUC
计算公式

yijuan_hw的专栏
10-19
2106

形象
理解
AUC
计算公式
AUC是评价一个二分类器性能
的主流数值指标，定义为
ROC曲线下方
的面积，但这个算起来比较复杂，需要统计假阳性。另一个定义更直观，随机给一个正样本
和一个负样本，多大概率正样本
的score更高。换一种说法，假设正样本有MMM个，负样本有NNN个，在所有M∗NM*NM∗N个正负样本
对中，有多少正样本比负样本分高。提高
AUC意味着，将所有样本按score排序，正样本要尽量排在负样...

AUC
的计算方法

热门推荐

SCUT_Sam
11-29
10万+

摘要: 在机器学习
的分类任务中，我们常用许多
的指标，诸如召回率（Recall）、准确率（Precision）、F1值、
AUC等。那么，如果如果手动计算
AUC应该要怎么计算呢？相信大家很多时候都是用写好
的库直接计算，可能
对
AUC计算不太了解，下面这篇文章就简单
的概述一下
AUC
的计算方法。（注：本文
的重点其实不在于阐述什么是
AUC。因为网上关于这方面
的文章实在太多了。但是
对于
AUC
的计算
的文

AUC公式原理详解

Jacquelin_1的博客
04-09
1989

AUC：随机抽出一
对样本（一个正样本，一个负样本），然后用训练得到
的分类器来
对这两个样本进行预测，预测得到正样本
的概率大于负样本概率
的概率。开始抽样：在有M个正样本,N个负样本
的数据集里。一共有MN
对样本（一
对样本即，一个正样本与一个负样本）。统计这MN
对样本里，正样本
的预测概率大于负样本
的预测概率
的个数。计算：（一） 2个正样本：C,D 2个负样本：A,B 样本
对：(C,A) (C,B...

AUC
的计算

07-09
4219

AUC
的计算方法

AUC
计算公式及python代码

_37668436的博客
03-20
3094

前言
auc
的主要用于分析二分类
的准确率，并且主要是
对回归任务做分析，当然分类也阔以。计算原理一个原理是
roc曲线
的面积，但是比较复杂，代码不好实现所以基本上不会那么写，还一个是基于rank
的公式计算，原理比较复杂，本文介绍最简单
的实现。计算原理：遍历正负样本
对正样本
的概率大于负样本，
auc += 1 正样本
的概率等于负样本，
auc += 0.5 正样本
的概率小于负样本，
auc += 0 遍历完毕，
auc =
auc / 正负样本
对数举个例子： label = [1, 0, 0,] pre

win7或win10环境DockerToolbox安装教程

NT的博客
09-11
1万+

win7或win10环境DockerToolbox安装教程首先在docker官网注册账号并下载好DockerToolbox.exe，注册账号需要翻墙。网上也有别人分享
的安装包，这一步只能自己想办法了。下面开始安装图文教程： 1. 双击运行DockerToolbox.exe，出现如下窗口，直接Next； 2. 在这一步选择一个安装目录，自行选择。目录中最好不要有中文，然后Next ...

数据分析（1）描述分析

vanni01的博客
09-09
231

一、基本统计分析 1、样本均值： 2、样本中位数： 3、样本分位数 4、样本众数 5、样本极差 6、样本方差：SUM((样本值-样本均值)^2 )/n-1 7、样本标准差：POWER（样本方差，2） 8、频数：样本值出现次数 9、峰度：大于0比标准正太陡，小于0比正太分布平缓 10、偏度：大于0峰值靠右侧，小于0峰值靠左侧 11、Z分位：样本值与样本均值相差多少个标准差（标准差倍数） 12、T分位：Z分位
的线性变换（为了数据更好看一些）二、探索分析 1、正态性检验：样本是否符合正太分布 2、卡方检验：交叉

关于
AUC
计算公式推导

BUPT-WT的博客
04-08
3658

基本公式推算基本排名
的公式推算注：推荐系统
的评估指标就是
AUC，之前看过
AUC
的公式，网上很多讲解
AUC
的帖子讲
的都不是很清楚，实现起来都是调包，今天早上突然看到学习资料里面有一个pdf文件(这个文件也没有备注是谁写
的，哈哈哈)介绍
AUC
的公式推导
的，讲
的比较清楚，我看懂啦，分享给大家！ ...

auc
计算公式推导与Python代码实现

wxgaws的博客
03-20
527

参考
AUC计算方法与Python实现代码 python计算
auc指标代码 def cal
AUC(prob,labels): f = list(zip(prob,labels)) rank = [values2 for values1,values2 in sorted(f,key=lambda x:x[0])] rankList = [i+1 for i in range(len(rank)) if rank[i]==1] posNum = 0 negNum = 0 for

对
AUC
计算公式
和
几何
意义
的
理解(详细版)

weixin_30296405的博客
06-06
300

对
AUC
的一些
理解1.
AUC（Area Under
ROC Curve）是
对机器学习模型
的一种性能度量，其直观
的
意义是
ROC（Receiver Operating Characteristic）围成
的面积，然而很多文章
对
AUC
的
计算公式与其直观
意义“面积”
的
对应描述不甚明了，于是我花了一些时间研究了
AUC
的
计算公式
和
几何
意义，全是我个人
理解，如有不
对，还望指出。本文代码在 https://git...

auc
计算公式_
auc
的
理解

weixin_39622562的博客
11-26
380

AUC
的概率
意义：　　
AUC是衡量二分类模型优劣
的一种评价指标，表示预测
的正例排在负例前面
的概率。计算方法：计算
ROC曲线下面
的面积计算模型将正样本排在负样本前面
的概率。计算假设总共有（m+n）个样本，其中正样本m个，负样本n个，总共有m*n个样本
对，计数，正样本预测为正样本
的概率值大于负样本预测为正样本
的概率值记为1，累加计数，然后除以（m*n）就是
AUC
的值。
计算公式 　　为了求
的组合中...

AUC含义
的通俗
理解

_38032064的博客
03-17
1万+

AUC含义
的通俗
理解假设有一个分类器，并且该分类器可以得到将一个样本预测为正
的概率，并将此概率称为这个样本
的得分。首先说一下
AUC
的含义：随机给定一个正样本
和一个负样本，用一个分类器进行分类
和预测，该正样本
的得分比该负样本
的得分要大
的概率。那么应该如何
理解这个含义呢？首先我们要知道
ROC曲线是怎么画出来
的。而
AUC即
ROC曲线下面
的面积。 1.
混淆矩阵 （图源：https://www.z...

“相关推荐”对你有帮助么？

非常没帮助

没帮助

一般

有帮助

非常有帮助

提交

©️2022 CSDN
皮肤主题：技术黑板
设计师：CSDN官方博客
返回首页

luputo

CSDN认证博客专家
CSDN认证企业博客

码龄6年
暂无认证

160

原创

4万+

周排名

185万+

总排名

21万+
访问

等级
3763
积分
135
粉丝
205
获赞
102
评论
690
收藏

私信

关注

热门文章

Manjaro安装 23404

Manjaro-i3的安装 19439

Pytorch 默认参数初始化 14908

对AUC计算公式和几何意义的理解 10284

Pytorch自定义参数 7999

分类专栏

论文 1篇

pytorch 5篇

学习笔记 61篇

OpenCV 5篇

【Python高级编程】笔记 1篇

Python 3篇

Web 1篇

some math 1篇

论文笔记 41篇

会议笔记 1篇

cheatsheet 5篇

C++

最新评论

考研考个好大学: 你有病吗人家自己写个笔记不想看可以不看，刷什么存在感呢 Auto-Encoding Scene Graphs for Image Captioning 论文阅读笔记

QXYang686: nn.ModuleList和nn.ModuleDict 有时候我们为了图省事，可能会这样写网络 ... 同样，输出网络的参数啥也没有，这意味着当调用net.cuda时，self.linears里面的参数不会一起走到GPU上去这个地方有问题吧，nn.Linear自己会注册里面的参数，所以参数是可以打印出来的，这样写是可以的。 Pytorch参数注册问题和nn.ModuleList nn.ModuleDict

子覃: 这个不是SVM吧，应该是SMO SVM 论文阅读笔记

非典型废言: 伪标签第二十三周学习笔记

非典型废言: 写得好啊动手搭建一个基于GMM-HMM的嵌入式命令词识别系统

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐

不推荐

一般般

推荐

强烈推荐

提交

最新文章

「AAAI2021」Image Captioning 图像描述生成，性能SoTA！

动手搭建一个基于GMM-HMM的嵌入式命令词识别系统

OS

2021年1篇

2020年3篇

2019年120篇

2018年34篇

2017年9篇

目录

目录

分类专栏

论文 1篇

pytorch 5篇

学习笔记 61篇

OpenCV 5篇

【Python高级编程】笔记 1篇

Python 3篇

Web 1篇

some math 1篇

论文笔记 41篇

会议笔记 1篇

cheatsheet 5篇

C++

目录

评论
9

被折叠的
条评论为什么被折叠?
到【灌水乐园】发言
查看更多评论

打赏作者

luputo

你的鼓励将是我创作的最大动力

¥2
¥4
¥6
¥10
¥20

输入1-500的整数

余额支付 (余额：-- )
扫码支付

扫码支付：
¥2

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

打赏作者

实付
元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

余额充值

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/176021.html原文链接：https://javaforall.net

对AUC计算公式和几何意义的理解

对AUC的一些理解1.

混淆矩阵

分类

ROC曲线

基本概念

ROC曲线的绘制

AUC

问题简化

原问题

关于作者

全栈程序员-站长

发表回复

对AUC计算公式和几何意义的理解

对AUC的一些理解1.

混淆矩阵

分类

ROC曲线

基本概念

ROC曲线的绘制

AUC

问题简化

原问题

“相关推荐”对你有帮助么？

关于作者

全栈程序员-站长

相关推荐

idea如何删除一行_idea关联tomcat

强化学习： 贝尔曼方程与马尔可夫决策过程

无法配置成功idea里的tomcat_idea配置没有配置tomcat这个选项

LAMP+haproxy+varnish实现网站访问的动静分离及静态资源缓存

Fluter 应用调试

platform_driver_register( )过程追踪

发表回复

强化学习：贝尔曼方程与马尔可夫决策过程