决策树的原理_决策树特征选择

决策树的原理_决策树特征选择决策树的原理:根据树结构进行决策,可以用于分类和回归。一颗决策树包括一个根结点、若干个内部节点和若干个叶节点。从根节点出发,对每个特征划分数据集并计算信息增益(或者增益率,基尼系数),选择信息增益最大的特征作为划分特征,依次递归,直至特征划分时信息增益很小或无特征可划分,形成决策树。决策树优点1.计算复杂度不高;2.输出结果易于理解;3.不需要数据预处理;4…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

  • 决策树的原理:根据树结构进行决策,可以用于分类和回归。一颗决策树包括一个根结点、若干个内部节点和若干个叶节点。从根节点出发,对每个特征划分数据集并计算信息增益(或者增益率,基尼系数),选择信息增益最大的特征作为划分特征,依次递归,直至特征划分时信息增益很小或无特征可划分,形成决策树。
决策树
优点 1. 计算复杂度不高; 2. 输出结果易于理解; 3. 不需要数据预处理; 4. 对中间值的缺失不敏感; 5. 可以处理不相关特征数据; 6. 对于异常点的容错率高
缺点 1. 可能产生过拟合的现象; 2. 对于比较复杂的关系很难学习; 3. 样本发生一点点变化会导致树的结构剧烈变动
  • 决策树的算法:ID3算法、C4.5算法、CART算法
算法 优缺点
ID3算法 不足: 无法处理连续特征;信息增益使得算法偏向于取值较多的特征;没有考虑缺失值和过拟合的问题。
C4.5算法 优点: 可以处理连续特征,引入增益率校正信息增益,考虑了数据缺失和过拟合的问题;不足: 剪枝方法有优化空间,生成的多叉树运算效率不高,大量对数运算和排序运算很耗时,只能用于分类不能回归。
CART算法 优点: 解决了C4.5算法的不足,可分类可回归;不足: 树的结构会由于样本的小变化发生剧烈变动,特征选择时都是选择最优的一个特征来做分类决策。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/197767.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • RST报文详解_modbus网关使用方法

    RST报文详解_modbus网关使用方法我们知道TCP建立连接的时候需要三次连接,TCP释放连接的时候需要四次挥手,在这个过程中,出现了很多特殊的标志报文段,例如SYNACKFIN,在TCP协议中,除了上面说了那些标志报文段之外,还有其他的报文段,如PUSH标志报文段以及今天需要重点讲解的RST报文段。RST:(Resettheconnection)用于复位因某种原因引起出现的错误连接,也用来拒绝非法数据和请求。如果接收到R…

    2022年10月1日
    0
  • wordpress php.ini路径,尝试通过将php.ini放在wordpress root中来启用allow_url_fopen不起作用…

    wordpress php.ini路径,尝试通过将php.ini放在wordpress root中来启用allow_url_fopen不起作用…好吧,我正在构建一个花哨的裤子wordpress主题和部分主题有PHP获取图像宽度和使用这些数字来调整页面元素.它在我的本地机器上工作正常,但是当我使用cpanel将主题放在我的托管服务器上时,它不起作用.我收到这个错误Warning:getimagesize()[function.getimagesize]:http://wrapperisdisabledintheserver…

    2022年7月21日
    10
  • [ACM] hdu 5045 Contest (减少国家Dp)

    [ACM] hdu 5045 Contest (减少国家Dp)

    2022年1月2日
    44
  • jetbrains2021全家桶永久激活码[最新免费获取]

    (jetbrains2021全家桶永久激活码)这是一篇idea技术相关文章,由全栈君为大家提供,主要知识点是关于2021JetBrains全家桶永久激活码的内容IntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,下面是详细链接哦~https://javaforall.net/100143.htmlS32PGH0SQB-eyJsa…

    2022年3月26日
    322
  • EXCEL 出错 8000401a

    EXCEL 出错 8000401a检索COM类工厂中CLSID为{00024500-0000-0000-C000-000000000046}的组件时失败,原因是出现以下错误:8000401a先用骨哥狗了一会,没解决方案,又用摆渡,也没找到方法,最后还是看微软的帮助解决了问题:1.打开DCOM配置,取消交互式用户,使用启动用户2.安全中附足够权限,不知道用户是谁就写Everyonehttp://suppo…

    2022年7月25日
    7
  • U盘启动和量产_u盘量产容量恢复

    U盘启动和量产_u盘量产容量恢复  今天装系统,光盘启动老是不行,心血来潮就想做一个U盘启动,刚好有个金士顿的Datatravalor16G的U盘,就下载USBBoot作启动盘,zip模式直接不行,HDD倒是可以格,格完后,就只有2G了。在系统管理里可以看到剩余的空间,但无法使用。  于是找芯片识别,找量产工具,完全不会用,试了2个小时,才找到门路:先用F1程序生成配置文件,其实就是U盘想做成什么样子,然后在量产工具中加载…

    2022年9月9日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号