KNN与SVM对比&SVM与逻辑回归的对比

KNN与SVM对比&SVM与逻辑回归的对比

首先说一下两种学习方式: lazy learning  和  eager learning

先说 eager learning, 这种学习方式是指在进行某种判断(例如,确定一个点的分类或者回归中确定某个点对应的函数值)之前,先利用训练数据进行训练得到一个目标函数,待需要时就只利用训练好的函数进行决策,这是一种一劳永逸的方法, SVM 就属于这种学习方式;

而 lazy learning 是指只有到了需要决策时才会利用已有数据进行决策,而在这之前不会经历eager learning 所拥有的训练过程, KNN 属于这种方式。

 

Eager learning 考虑到了所有训练样本,说明它是一个全局的近似,优点是虽然它需要耗费训练时间,可是它的决策时间基本为 0。

Lazy learning 在决策时虽然需要计算所有样本与查询点的距离,但是在真正做决策时却只用了局部的几个训练数据,所以它是一个局部的近似,然而虽然不需要训练,它的复杂度还是需要 O(n),n 是训练样本的个数。

Lazy learning 的缺点: 1.  需要的存储空间比较大  2. 决策过程比较慢。

 

针对全局和局部的问题,我想了一个实际的例子。假设,现在我们要针对中国各地区的贫富问题进行划分,已经知道西部大部分地方比较贫穷,少部分地方富裕;而东部大部分地方富裕,少部分地方贫穷。首先,我们使用 SVM进行求解,按照 SVM 的思想,最后的结果一定是沿着中国地图无情的划一条线,而用KNN 时,东部城市中北京,上海等算是富裕的,而菏泽啊这样的就不太富裕;西部呢,像成都啊(不知道算不算西部,就假设算吧)算是富裕的,西宁啊这样的算是不太富裕的。

使用应用KNN算法时,我们无法对预测的误差有一个统计意义上的估计,结果的波动可能很大,这通常不是我们希望看到的。但是KNN的实现简单,使用灵活,也有自己的用武之地。

 

参考:http://www.52ml.net/10152.html

 

因此:

SVM需要训练过程,预测效率高。

KNN计算复杂度高,但是需要调的参比较小。

 

 

至于
逻辑回归和SVM,一个统计的方法,一个几何的方法,逻辑回归对于每一个样本都有考虑,而SVM只考虑了支持向量。
同样的线性分类情况下,如果异常点较多的话,无法剔除,由于LR中每个样本都是有贡献的,因此分类效果会受到影响,可能存在过拟合。
LR模型找到的那个超平面,是尽量让所有点都远离他,而SVM寻找的那个超平面,是只让最靠近中间分割线的那些点尽量远离,即只用到那些支持向量的样本。

<span>KNN与SVM对比&SVM与逻辑回归的对比</span>

 

理由:因为训练样本数量特别大,使用复杂核函数的SVM会导致运算很慢,因此应该考虑通过引入更多特征,然后使用线性核函数的SVM或者lr来构建预测性更好的模型。

SVM有多种核可以选择,可以处理各种非线性问题(条件是选对核函数)。大多数情况准确率都比LR要高,但是模型较大,训练效率低。

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/119459.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • XGBoost的基本原理

    XGBoost的基本原理XGBoost原理与实践

    2022年5月30日
    37
  • Sober算子边缘检测与Harris角点检测1「建议收藏」

    Sober算子边缘检测与Harris角点检测1「建议收藏」此篇文章主要介绍了Sobel算子的底层运算规律,和cvHarris的相关介绍Harrisopencv的对应代码cv2.cornerHarris(src,blockSize,ksize,k[,dst[,borderType]])参数类型src-输入灰度图像,float32类型blockSize-用于角点检测的邻域大小,就是上面提到的窗口的尺寸ksize-用于计算梯

    2022年7月14日
    21
  • java解析xml汇总

    java解析xml汇总

    2022年3月7日
    37
  • 一文教你了解SSL协议「建议收藏」

    一文教你了解SSL协议「建议收藏」什么是SSL简称是SSL,全称SecureSocketsLayer安全套接字协议,一般我们在学习SSL的时候,都会和TLS一起来学习的,为什么呢?因为SSL和TLS都是为网络通信提供安全及数据完整性的一种安全协议。TLS与SSL在传输层与应用层之间对网络连接进行加密。我们先看SSL协议,然后在看TLS协议。SSL协议位于TCP/IP协议与各种应用层协议之间,为数据通讯提供安全支持。SSL协议可分为两层: SSL记录协议(SSLRecordProtocol)

    2022年5月31日
    37
  • Effective C++学习笔记(Part Two:Item 5-12)[通俗易懂]

    Effective C++学习笔记(Part Two:Item 5-12)

    2022年3月3日
    41
  • PotPlayer下载与使用

    PotPlayer下载与使用下载安装说起来,Potplayer的下载其实并不轻松,它在国内是没有自己的官网;虽然你简单百度下,总能找到下载网站,但是并不能保证其安全和纯净,个人建议从这个官网下载:下载入口:Potplayer官网/公众号分享Potplayer的官网提供有64位和32位两种版本,我们只需要选择好适合自己系统类型的版本,点击下载;一般系统都是64位,如果还不知道的自己电脑系统类型,那么右键桌面“我的电脑”图标,选择“属性”,进入之后,即可查看;下载完成后,得到一个exe文件,双击打开;依次点击“下一步

    2022年7月12日
    35

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号