roc曲线的意义_Pre / Rec / ROC / PR「建议收藏」

roc曲线的意义_Pre / Rec / ROC / PR「建议收藏」Precision和Recall值是既矛盾又统一的两个指标,为了提高Precision值,分类器需要尽量在“更有把握”时(即,提高分类阈值!)才把样本预测为正样本,但此时往往会因为过于保守而漏掉很多“没有把握”的正样本,导致Recall值降低。ROC(ReceiverOperatorCharacteristic)曲线被广泛应用于二分类问题中来评估分类器的可信度,但是当处理一…

大家好,又见面了,我是你们的朋友全栈君。

Precision 和 Recall值是既矛盾又统一的两个指标,为了提高 Precision 值,分类器需要尽量在 “更有把握” 时(即,提高分类阈值!)才把样本预测为正样本,但此时往往会因为过于保守而漏掉很多 “没有把握” 的正样本,导致 Recall 值降低。

ROC(Receiver Operator Characteristic)曲线被广泛应用于二分类问题中来评估分类器的可信度,但是当处理一些高度不均衡的数据集时,PR 曲线能表现出更多的信息,发现更多的问题。

首先理解这四个基本指标:

9f313402767be5e69ef2e89b5881fc57.png

ROC曲线中,是以FPR为x轴,TPR为y轴。

PR曲线中,以Recall为x轴,Precision为y轴。

绘制ROC曲线和PR曲线都是选定不同阈值,从而得到不同的x轴和y轴的值,画出曲线。

在 ROC 空间,ROC 曲线越凸向左上方向效果越好,但是,PR 曲线是右上凸效果越好。

当正负样本比例差距不大时,ROC和PR的趋势是差不多的,当正负样本比例差距很大时,ROC效果依然看似很好,但是PR曲线则会表现的比较差。

所以,PR曲线在正负样本比例悬殊较大时,更能反映分类器的性能。

当正负样本分布发生变化时,ROC 曲线的形状能够基本保持不变,而 P-R 曲线的形状一般会发生较剧烈的变化。这个特点让 ROC 曲线能够尽量降低不同测试集带来的干扰,更加客观地衡量模型本身的性能

这有什么实际意义呢?在很多实际问题中,正负样本数量往往很不均衡。比如,计算广告领域经常涉及转化率模型,正样本的数量往往是负样本数量的 1/1000 甚至 1/10000。若选择不同的测试集,P-R 曲线的变化就会非常大,而 ROC 曲线则能够更加稳定地反映模型本身的好坏。

所以,ROC 曲线的适用场景更多,被广泛用于排序、推荐、广告等领域。但需要注意的是,选择 P-R 曲线还是 ROC 曲线是因实际问题而异的,如果研究者希望更多地看到模型在特定数据集上的表现,P-R 曲线则能够更直观地反映其性能。

AUC(Area Under Curve) 即指曲线下面积占总方格的比例。有时不同分类算法的 ROC 曲线存在交叉,因此很多时候用 AUC 值作为算法好坏的评判标准。面积越大,表示分类性能越好。

wdmad:机器学习之类别不平衡问题 (2) —— ROC和PR曲线​zhuanlan.zhihu.com

10860a781b0eae86afa08179bd55df8f.png

(分析了ROC曲线的优缺点,以及ROC和PR的使用场景)

ROC曲线和PR(Precision-Recall)曲线的联系_SEAN是一只程序猿​www.fullstackdevel.com

7670f2ababefbf9e289a7322a188aff3.png

(解释了ROC和PR曲线的概念与画法)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/145450.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 部门年终会议如何开_关于召开年度工作总结会议的通知

    部门年终会议如何开_关于召开年度工作总结会议的通知前言:最近有同学问我,部门年终总结会议要不要开,是否有这个必要?那我就说说我的观点,关注我的同学都知道我上月初刚参加完团队的年终总结,我想我应该很有发言权!部门年终总结会议有必要开吗?一、这是否有你的心理?二、那到底要不要开?三、个人感慨!一、这是否有你的心理?每年的年终,不仅个人要写年终总结,团队的leader也要复盘团队一年的工作情况以及来年的展望。很多人都会认为这个无非就是走个形式,给上面的领导看,基本没有任何意义,大家就无非聚集在一起,开个无聊的会,讲完后大家屁股一抬,工作的事全部重来!二

    2022年9月25日
    0
  • 局域网的dos攻击指定ip_局域网被攻击

    局域网的dos攻击指定ip_局域网被攻击1.确保自己的网卡支持monitor模式https://blog.csdn.net/qq_33826977/article/details/628977182.用mdk3工具实施dos攻击2.1信标洪水攻击:mdk3mon0b-c12.2身份验证洪水攻击mdk3mon0a-a08-57-00-43-1E-B22.3取消身份验证洪水攻击aireplay-ng-o…

    2022年10月1日
    0
  • (2021 最新版)IntelliJ IDEA 下载安装及配置教程

    (2021 最新版)IntelliJ IDEA 下载安装及配置教程前言因为自己电脑最近实在是太卡了,也一直提示更新,索性就直接重装了个系统。因为需要重装下IDEA,而现在新版本的IDEA和之前的版本还是有很大变化的,所以在这里写一篇博客做个记录,方便自己后续配置,也顺便分享给大家。准备工作既然要安装IDEA,那么首先需要前往JetBrains的官网下载最新版的IDEA,下载地址如下:https://www.jetbrains.com/idea/download/这里最新的版本是2021.1.2,而因为我有旗舰版的账号,所以这里就以旗舰版安装

    2022年5月20日
    915
  • 数据挖掘之时间序列分析[通俗易懂]

    数据挖掘之时间序列分析[通俗易懂]按时间顺序排列的一组随机变量X1,X2,…,Xt表示一个随机事件的时间序列。时间序列分析的目的是给定一个已被观测了的时间序列,预测该序列的未来值。表1常用的时间序列模型 模型名称 描述 平滑法 常用于趋势分析和预测,利用修匀技术,削弱短期随机波动对序列的影响,使序列平滑化。 根据所用平滑技术的不同,可分为移动平均法和指数平滑法。 趋势拟合法…

    2022年6月22日
    28
  • oracle 11g 怎么安装,oracle 11g安装图解 Oracle 11g安装图文教程[通俗易懂]

    oracle 11g 怎么安装,oracle 11g安装图解 Oracle 11g安装图文教程[通俗易懂]之前也找过oracle11g安装图解,不过一直没找到合适的Oracle11g安装图文教程,下面这篇oracle11g安装图解比较详细,希望对Oracle学习者有帮助:一、Oracle下载注意Oracle分成两个文件,下载完后,将两个文件解压到同一目录下即可。路径名称中,最好不要出现中文,也不要出现空格等不规则字符。官方下地址:http://www.oracle.com/technetwo…

    2022年9月21日
    0
  • 热血传奇服务端源码(传奇类 手游源码)

    缘起因由在一个无所事事的周末下午,突然想起魔兽世界,官方的账号很久没有上了,里面的大小号现在连满级都不是。以前曾经搭过传奇和星际争霸战网的私服自娱自乐,也听说过魔兽世界有开源的服务端模拟,既然兴致来了就小小的研究一下。目前魔兽世界的私服比较流行的是MaNGOS和Trinity,二者都是模拟魔兽世界服务端。MaNGOS“号称”是一个研究型项目,目的是为了学习大规模的C++项目开发,有

    2022年4月16日
    115

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号