SVM支持向量机原理总结

SVM支持向量机原理总结文中借鉴引用 CSDN 各大博主文献 图片 并非完全原创 支持向量机 SVM 是一种二类分类模型 其基本模型是定义在特征空间上的间隔最大的线性分类器 硬间隔 要求所有样本又必须划分正确软 j 间隔 允许一些样本 不满足 w t x b gt 1 出错 当训练数据线性可分时 通过硬间隔最大化 学习一个线性的分类器 即线性可分支持向量机 硬间隔 SVM 当训练数据近似线

文中借鉴引用CSDN各大博主文献,图片,并非完全原创。

支持向量机SVM是一种二类分类模型,其基本模型是定义在特征空间上的间隔最大的线性分类器。 

硬间隔:要求所有样本又必须划分正确 

软j间隔:允许一些样本(不满足(w^t)x + b >= 1)出错。 

 

当训练数据线性可分时:通过硬间隔最大化,学习一个线性的分类器,即线性可分支持向量机(硬间隔SVM)。 

当训练数据近似线性可分时:通过软间隔最大化,学习一个线性的分类器,即线性支持向量机(软间隔SVM) 

当训练数据线性不可分时:通过使用核技巧及软间隔最大化,学习非线性支持向量机。 

 

 

支持向量机包括的内容: 

支持向量  最大间隔  线性可分/不可分 凸优化问题  对偶问题   核函数的使用  SMO算法 

 

 

对于SVM和LR的异同: 

 

相同: 

SVM支持向量机原理总结

 

 

不同: 

SVM支持向量机原理总结

 

SVM支持向量机原理总结

SVM支持向量机原理总结

 

 

线性可分支持向量机

让我们从一个线性分类任务开始 

 

       如果一个线性函数能够将样本分开,我们称这些数据样本是线性可分的。那么什么是线性函数? 在二维空间中,线性函数就是一条y关于x的直线,三维空间就是一个平面,以此类推。如果不考虑空间维数,那么这个间隔函数被统称为超平面。 

 

硬间隔支持向量机 

 

间隔最大化和支持向量: 

对于一个二维空间,如下图: 

SVM支持向量机原理总结

      有很多条线都能将其分开(无数条)。而我们所说的线性可分支持向量机就对应着能将数据正确划分并且间最大的直线。 

SVM支持向量机原理总结

SVM支持向量机原理总结

 

 

那么怎么才能间隔最大?一般来说,一个点距离超平面的远近可以表示为分类预测的确信度,一开始图中的A,B两点,B被预测为正类的确定度大于A。所以SVM的目标是寻找一个超平面,使得离超平面较近的异类点能够有更大的间隔。即:不用考虑所有点,只需让求得的离超平面使离它近的点的间隔最大。 

 

计算间隔: 

SVM支持向量机原理总结

 

 

其实间隔说白了就是:两个异类支持向量的差在W方向上的投影,W方向是超平面的法线方向。 

SVM支持向量机原理总结

 

最后的结论公式便是支持向量机的基本型。 

。该基本型是一个凸二次规划问题,什么是凸二次规划见数学基础(凸)。 

 

SVM支持向量机原理总结

SVM支持向量机原理总结

 

SVM支持向量机原理总结

 

SVM支持向量机原理总结

 

软间隔支持向量机 

      在前面的讨论中,我们假设训练样本在样本空间或特征空间是线性可分的,但在现实任务中往往很难确定合适的核函数(见非线性与核)使得训练集在特征空间中线性可分。退一步说,即使恰好找到了这样的核函数使得样本在特征空间中线性可分,也很难判断是不是由于过拟合做成。 

 

松弛变量:为了解决这种问题,可引入松弛变量。 

       

SVM支持向量机原理总结

SVM支持向量机原理总结

 

 

 

       

非线性与核

 

对于非线性问题,线性可分支持向量机并不能有效解决,要使用非线性模型才能很好的分类。 

如下图:可以使用一个椭圆将它们分开。非线性问题往往不好求解,所以希望能使用解线性分类问题的方法求解,因此可以采用非线性变换,将非线性函数变换为线性函数。 

 

SVM支持向量机原理总结

 

对于这种问题:可以将训练样本从原始空间映射到一个更高维的空间,使得样本在这个空间中线性可分。如果原始空间维数是有限的,即属性是有限的,那么一定存在一个高维特征空间是线性可分的。令ϕ(x)表示将 x 映射后的特征向量,于是在特征空间中,划分超平面所对应的的模型可表示为: 

SVM支持向量机原理总结

SVM支持向量机原理总结

即xi和xj在特征空间中的内积等于他们在原始样本空间中通过函数k(xi,xj)计算的函数值。 

SVM支持向量机原理总结

SVM支持向量机原理总结

 

  

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/179300.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月26日 下午3:54
下一篇 2026年3月26日 下午3:55


相关推荐

  • 饭否2359条之微信成长记录[通俗易懂]

    饭否2359条之微信成长记录[通俗易懂]微信成长时间表下面是百度百科的微信成长时间表:2011年1月21日,微信发布针对iPhone用户的1.0测试版。该版本支持通过QQ号来导入现有的联系人资料,但仅有即时通讯、分享照片和更换头像等简单功能。[6] 在随后1.1、1.2和1.3三个测试版中,微信逐渐增加了对手机通讯录的读取、与腾讯微博私信的互通以及多人会话功能的支持,截至2011年4月底,腾讯微信

    2022年5月15日
    54
  • 比和比例的联系和区别

    比和比例的联系和区别比和比例一直是学数学容易弄混的几大问题之一,其实它们之间的问题完全可以用一句话概括:比,等同于算式中等号左边的式子,是式子的一种(如:a:b);比例,由至少两个称为比的式子由等号连接而成,且这两个比的比值是相同(如:a:b=c:d)。所以,比和比例的联系就可以说成是:比是比例的一部分;而比例是由至少两个比值相等的比组合而成的.比和比例的区别:区别区别1:意义、项数、各部

    2022年5月14日
    50
  • 网站被挂马了如何清理_网站在线挂马检测工具

    网站被挂马了如何清理_网站在线挂马检测工具
     
    您好,今天我们讲下挂马的危害和处理办法。挂马是常见的对网站和客户都影响巨大的危害之一。
          上海快网的经验是:如果是在访问出来的源文件的头上,或是最后有被加代码,这个一般是网站文件被要改了,或是ARP,如果是源文件的很多数据位置(中间),那一般是数据库被人挂了。
         不完全统计,90%的网站都被挂过马,挂马是指在获取网站或者网站服务器的部分或者全部权限后,在网页文件中插入一段恶意代码,这些恶意代码主要是一些包括IE等漏洞利用代码,用户访问被挂马

    2026年4月19日
    4
  • rabbitmq常见面试题「建议收藏」

    rabbitmq常见面试题「建议收藏」1、使用RabbitMQ有什么好处?1.解耦,系统A在代码中直接调用系统B和系统C的代码,如果将来D系统接入,系统A还需要修改代码,过于麻烦!2.异步,将消息写入消息队列,非必要的业务逻辑以异步的方式运行,加快响应速度3.削峰,并发量大的时候,所有的请求直接怼到数据库,造成数据库连接异常2、RabbitMQ中的broker是指什么?cluster又是指什么?bro…

    2022年6月22日
    28
  • 什么叫侧面指纹识别_侧面指纹识别真的只是大法一家独有?

    什么叫侧面指纹识别_侧面指纹识别真的只是大法一家独有?好久不见~!,ZAKER科技的各位机友们,第14期《每周猜机》又跟大家见面了。每周猜机到14期了,这期间离不开各位同学的支持,也希望各位同学能继续关注这个栏目。先透漏这期的主题也是前两期前后指纹识别主题的延伸,请各位猜机大神再接再厉,接下这期猜机:前两期的每周猜机,师兄已经可以看出各位同学对于前后指纹识别都有自己的见解,两方僵持不下,那师兄这次就提出一个中立解决方案——侧面指纹识别,现…

    2022年6月26日
    190
  • Google资深工程师深度讲解Go语言–面向接口(五)[通俗易懂]

    Google资深工程师深度讲解Go语言–面向接口(五)

    2022年2月15日
    46

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号