长尾分布数据_厚尾分布

长尾分布数据_厚尾分布长尾分布数据11.什么是长尾分布数据长尾分布数据是一种偏态分布,是指几个类别(亦叫头类)包含大量的样本,而大多数类别(亦叫尾类)只有非常少量的样本。类似这样的数据集会使得深度学习网络在头部类中表现良好,在尾部类中效率不高,整体的识别精度显著下降。2.解决办法大多数研究者通过不平衡学习策略来解决长尾识别问题,主要分为两类:数据级方法和算法级方法。数据级方法数据水平的策略包括尾部类过采样,头部类欠采样,以及其他新的抽样方法。所以解决手段主要着力于如何对数据进行抽样。这种方法存在的问题是,过采

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

长尾分布数据1

1. 什么是长尾分布数据

长尾分布数据是一种偏态分布,是指几个类别(亦叫头类)包含大量的样本,而大多数类别(亦叫尾类)只有非常少量的样本。

在这里插入图片描述

类似这样的数据集会使得深度学习网络在头部类中表现良好,在尾部类中效率不高,整体的识别精度显著下降。

2. 解决办法

大多数研究者通过不平衡学习策略来解决长尾识别问题,主要分为两类:数据级方法和算法级方法。

数据级方法

数据水平的策略包括尾部类过采样,头部类欠采样,以及其他新的抽样方法。所以解决手段主要着力于如何对数据进行抽样。这种方法存在的问题是,过采样会导致过拟合,欠采样会导致头部类大量有效信息丢失。

算法级方法

  • 通过成本敏感算法来调整类别权重,一定程度缓解长尾分布不平衡问题,提高了尾类识别精度,但降低了头类精度。
  • 将头部数据中学习到的知识迁移到尾类,这种迁移学习的缺点是在头尾类特征相差特别大的时候,效果不好。如头类是动物,尾类是植物。
  • 层次学习方法,将长尾识别问题转为层次化超类学习问题。知识的迁移是受限的,只能从超类转移到它的直接子类。如尾类哈士奇的识别过程中,首先将其识别为头类的动物类,再归类为一只哈士奇狗。这个过程中,动物的知识不会转移到植物类。即,对头部类的知识迁移进行了限制,限制的方式是父子类层次关联。

Reference


  1. Q. Chen, Q. Liu和E. Lin, 《A knowledge-guide hierarchical learning method for long-tailed image classification》, Neurocomputing, 卷 459, 页 408–418, 10月 2021, doi: 10.1016/j.neucom.2021.07.008. ↩︎

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/204018.html原文链接:https://javaforall.net

(0)
上一篇 2025年8月8日 下午6:43
下一篇 2025年8月8日 下午7:15


相关推荐

  • VC 下 volatile 变量能否建立 Memory Barrier 或并发锁

    VC 下 volatile 变量能否建立 Memory Barrier 或并发锁VC下volatile变量能否建立MemoryBarrier或并发锁

    2022年7月15日
    21
  • Python在线编译器 C语言在线编译器

    Python在线编译器 C语言在线编译器Python在线编译器C语言在线编译器

    2022年7月5日
    29
  • URG和PSH

    URG和PSHURG 与 PSHURG 和 PSH 是 TCP 协议中的两个控制位 URG 紧急位 当 URG 1 时 表明紧急指针字段有效 它告诉系统此报文中有紧急数据 应尽快传送 相当于高优先级的数据 而不需要按原来的排队顺序来传送 当 URG 1 时 发送应用进程告诉发送方的 TCP 有紧急数据要传送 于是紧急发送方就把紧急数据插入到本报文段数据的最前面 而紧急数据后面的数据依然是普通数据 这时要与首部中的紧急指针字

    2026年3月17日
    1
  • UPX脱壳(2)

    UPX脱壳(2)UPX简单脱壳

    2022年7月15日
    17
  • 极值点、驻点、拐点的区别和联系

    极值点、驻点、拐点的区别和联系文章目录前言 相关的概念定义和理解 极值点驻点拐点常用结论 举个例子前言 本文主要详细解释了极值点 驻点 拐点的含义 以及它们之间相互的联系和区别之处 希望可以加深读者对于这一类概念的理解 相关的概念定义和理解 极值点极值点 一阶导数发生变号的点 对于导数不存在的点 分析其左导数和右导数的正负是否相同 相同则不是极值点 若不同则为极值点 极值点是该点的 x 坐标值 而极值是该点对应的 y 坐标值 驻点驻点 只是单纯地符合 f xo 0 的点 导数不存在的点不是驻点 拐点拐点 二阶导数发生变号的点

    2026年3月26日
    2
  • Java程序设计(高级及专题)- 网络编程

    Java程序设计(高级及专题)- 网络编程Java程序设计(高级及专题)- 网络编程

    2022年4月22日
    46

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号