多标签分类(multilabel classification )

多标签分类(multilabel classification )这几天看了几篇相关的文章,写篇文章总结一下,就像个小综述一样,文章会很乱  1、multilabelclassification的用途     多标签分类问题很常见,比如一部电影可以同时被分为动作片和犯罪片,一则新闻可以同时属于政治和法律,还有生物学中的基因功能预测问题,场景识别问题,疾病诊断等。 2.单标签分类     在传统的单标签分类中,训练

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

    这几天看了几篇相关的文章, 写篇文章总结一下,就像个小综述一样, 文章会很乱

   1、multilabel classification的用途

         多标签分类问题很常见, 比如一部电影可以同时被分为动作片和犯罪片, 一则新闻可以同时属于政治和法律,还有生物学中的基因功能预测问题, 场景识别问题,疾病诊断等。

  2. 单标签分类

         在传统的单标签分类中,训练集中的每一个样本只有一个相关的标签 l ,这个标签来自于一个不重合的标签集合L,|L| > 1.当|L|=2 时,这就是一个二分类问题,或文本和网页数据的过滤(filtering)问题。当|L| > 2 时是多分类问题。

  3、多标签分类问题的定义

        简单的说就是同一个实例,可以有多个标签, 或者被分为多个类。和多分类的区别是, 多分类中每个实例只有一个标签。下面是几个形式化的定义。

       用多标签分类(multilabel classification )代表样本空间,多标签分类(multilabel classification )=多标签分类(multilabel classification ) 为有限标签集合, 我们假设多标签分类(multilabel classification )中的样本实例多标签分类(multilabel classification )多标签分类(multilabel classification )的一个子集多标签分类(multilabel classification )相关,这个子集称作相关标签集。同时补集多标签分类(multilabel classification )被认为与x不相关。相关标签集L用向量多标签分类(multilabel classification )标识,其中多标签分类(multilabel classification )。用多标签分类(multilabel classification )表示可能的标签集。

      一个多标签分类器h是一个映射多标签分类(multilabel classification ),对每一个实例多标签分类(multilabel classification )分配一个分配一个标签子集。因此分类器h的输出是一个向量多标签分类(multilabel classification )

  4、与多标签分类相关/相似的问题

        一个同属于监督学习并和多标签分类很相关的问题就是排序问题(ranking)。排序任务是对一个标签集排序,使得排在前面的标签与相应实例更相关。

      在特定分类问题中,标签属于一个层次结构(hierarchical structure)。当数据集标签属于一个层次结构的时候,我们这个任务为层次分类,如果一个样本与层次结构的多个节点相关, 那么这个任务就被称为层次多标签分类。

     多实例学习(multiple-instance learning)是监督学习的一个变种,用的比较少 ,就不说了。

  5. 多标签分类的方法

       方法基本上分为两种,一种是将问题转化为传统的分类问题,二是调整现有的算法来适应多标签的分类

       常用的转化方法有好几种,比如对每个实例确定或随机的分配一个标签,或只保留只有一个标签的训练样本,然后用传统的多分类方法去训练。这种方法会导致训练样本的损失,所以不推荐使用。还可以将训练样本按每个标签构造一个训练集,每个样本属于或不属于这个标签,对每个标签单独训练一个分类器,然后将多个分类器的结果合成。还有将每个多标签单独看做一个新标签,在一个更多的标签集上做多分类。当多标签样本比较少时,这个方法就比较受限。还有对每个有多个标签的样本,复制该样本,每个样本具有不同的标签,加入训练集后使用覆盖(coverage based)分类法。

     调整的算法也比较多,比如通过调整boost kNN  SVM等实现多分类,这些调整通常也会用到上面的转换。其中调整kNN实现的多标签分类可以加入先验概率,并能对输出标签排序。基于SVM的算法中,有人在训练集中加入了|L|个二分类的训练结果,然后再进行一次分类,这个方法考虑到了不同标签之间的依赖,也是应用栈(Stacking 多个分类器的叠加)的一个特殊情况。还有人利用了相关规则挖掘的方法。

  6. 评价标准

       令D表示多标签评价数据集,有|D|个多标签样本多标签分类(multilabel classification )。令H为一个多标签分类器,令多标签分类(multilabel classification )为有H基于多标签分类(multilabel classification )的预测结果集。

     下面是几个评价标准

      多标签分类(multilabel classification )

         多标签分类(multilabel classification )

           多标签分类(multilabel classification )

   7、 一点感悟

         多标签学习,还有层次结构学习等,多个标签之间一般不是独立(independent)的,所以好的算法要利用标签之间的依赖

         算法训练的时候要么降低cost function 要么学习贝叶斯概率,两种方法本质一样,但表现形式不一样

  8.  其它

       F-measure能比较好的平衡分类器对不同类别实例不同时在不同类上的表现,因此更适合于不平衡的数据。对一个m维二元标签向量 多标签分类(multilabel classification ),对给定的预测多标签分类(multilabel classification ),F-measure定义为:

多标签分类(multilabel classification )其中由定义,0/0=1

F-measure对应于精度和召回的调和平均。

多标签分类(multilabel classification )

对于最大化F-measure的方法,为了简化问题一般都基于一些假设, 有人用两个循环给出了精确解

就说这么多吧,不想写了

      

        

       

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/226733.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • eclipse添加git插件(eclipse git使用教程)

    想必现在搞互联网编程的人没有人没有听过编程协作工具git了吧,命令行下面操作非常方便,功能也非常的强大。但是对于java编程的人员,eclipse肯定是他们编程的神器(肯定是首选),那么如何在eclipse里面使用git了?今天就来念叨念叨这事。

    2022年4月10日
    79
  • 慎用域名url转发功能_url转发域名可以带端口吗

    慎用域名url转发功能_url转发域名可以带端口吗许多域名注册商或虚拟主机商都提供一种免费的URL转发功能,让拥有一个主网站并同时拥有多个域名的用户实现多个域名指向同一个网站或网站子目录,但具体是通过什么机制实现的则大都讳忌莫深,往往只说“通过服务器的特殊技术设置”。同时,大多数服务商提供的URL转发还包括两种,不隐藏路径的URL转发与隐藏路径的URL转发,其中,不隐藏路径的URL转发指在跳转后浏览器地址栏显示真正的目标地址,而隐藏路径的URL转…

    2022年10月18日
    2
  • 计算机中1kb表示的字节数是多少_在计算机中1KB是指几字节

    计算机中1kb表示的字节数是多少_在计算机中1KB是指几字节大家好,我是时间财富网智能客服时间君,上述问题将由我为大家进行解答。1kb等于1024个字节。kB(Kilobyte),是一种资讯计量单位,是计算机数据存贮器存储单位字节的多倍形式。现今通常在标识内存等具有一般容量的储存媒介之储存容量时使用。根据国际单位制标准,1kB=1000B(字节,Byte)。根据按照IEC命名标准,用于二进制存储单位的标准命名是KiB,MiB等,1kiB=1024B。这是由…

    2022年9月30日
    2
  • 共享计算机没有响应,网络共享打印机出现联机无反应的处理方法

    共享计算机没有响应,网络共享打印机出现联机无反应的处理方法网络共享打印机出现联机无反应、打印乱码及无法连接共享打印机的故障处理方法1、共享打印出现乱码倘若从局域网中某一台工作站中执行共享打印操作时,网络打印机能够正常工作;而从另外一台工作站中执行共享打印操作时,网络打印机打印出来的内容全部是乱码,遇到这种故障时你该如何快速排除呢?从上面的故障现象来看,大家可以知道共享打印机在硬件方面以及网络连接方面都应该是正常的,毕竟有计算机能够通过网络正常进行打印材料…

    2022年6月5日
    146
  • 网络流详解(流网图一般能够反映什么信息)

    network-flows,网络流,传说中的省选算法先推荐一个讲网络流思路的网站:https://www.cnblogs.com/ZJUT-jiangnan/p/3632525.html目的首先,明确网络流是干什么的给定指定的一个有向图,其中有两个特殊的点源S(Sources)和汇T(Sinks),每条边有指定的容量(Capacity),求满足条件的从S到T的最大流(MaxFlow)….

    2022年4月18日
    53
  • 原创教程PS修图技巧-如何用portraiture滤镜来进行人像磨皮

    原创教程PS修图技巧-如何用portraiture滤镜来进行人像磨皮原创教程PS修图技巧-如何用portraiture滤镜来进行人像磨皮我们平常拍照,都要用到PS修图,今天教大家如何修图磨皮,非常有价值有营养的教程,完全是自己写的,修图有时候并不是只是设计师的事,对于我们这些小白来说,也是想修好自己所拍的图片,然后这个图片能够获得朋友圈的赞赏,这个时候大家可以运用磨皮插件这个方法来进行人像修图,那接下来就来教教大家应该如何操作如何用portraiture来进行人像磨皮工具/原料电脑PhotoshopCC方法/步骤首先打开我们的软件,然后单击“文件

    2022年7月22日
    11

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号