决策树算法(Bagging与随机森林)

决策树算法(Bagging与随机森林)

Bagging算法:

将训练数据集进行N次Bootstrap采样得到N个训练数据子集,对每个子集使用相同的算法分别建立决策树,最终的分类(或回归)结果是N个决策树的结果的多数投票(或平均)。

其中,Bootstrap即为有放回的采样,利用有限的样本资料经由多次重复抽样,重新建立起足以代表母体样本分布之新样本。

 

随机森林:

随机森林是基于Bagging策略的修改算法,样本的选取采用Bootstrap采样,而属性集合也采用Bootstrap采样(不同之处)。

传统决策树在选择划分属性时是在当前结点的属性集合中选择一个最优属性;而在RF中,对每个样本构架决策树时,其每个结点,先从该结点的属性集合中随机选择一个包含k个属性的子集,然后再从这个子集中选择一个最优属性用于划分.。

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/119481.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • python舆情系统开发_什么是舆情

    python舆情系统开发_什么是舆情下面的这篇文章将手把手教大家搭建一个简单的股票舆情分析系统,其中将先通过金融界网站爬取指定股票在一段时间的新闻,然后通过百度情感分析接口,用于评估指定股票的正面和反面新闻的占比,以此确定该股票是处于利好还是利空的状态。1、环境准备本地环境:Python3.7IDE:Pycharm库版本:re2.2.1lxml4.6.3requests2.24.0aip4.15.5matplotlib3.2.1然后,导入需要用到的所有库:importrequest

    2022年9月20日
    4
  • MySQL数据库:索引的实现原理

    MySQL数据库:索引的实现原理

    2021年4月10日
    208
  • arrayqueue源码_thinkphp源码分析

    arrayqueue源码_thinkphp源码分析愉快地聊一聊ArrayDeque的特点吧~(以下都是基于jdk1.8)一棵树ArrayDeque的继承树如下图:基本特点(1)双端队列,可从两端添加、删除元素。作为队列使用时,性能优于LinkedList。作为栈使用时,性能优于Stack。(2)底层使用可变数组Object[]elements,数组容量按需增长(3)不能存储null(4)支持双向迭代器遍历(5)线程不安全…

    2022年9月20日
    3
  • vue引入外部js文件并使用_vue直接引入js文件没有用

    vue引入外部js文件并使用_vue直接引入js文件没有用1.在assest文件中存放js文件2.在要使用的组件中import,注意项目的路径关系“`import”../assets/BimfaceSDKLoader@latest-release.js”“`

    2022年10月8日
    1
  • 从伯努利分布到多项式分布的条件_伯努利分布的期望

    从伯努利分布到多项式分布的条件_伯努利分布的期望1.伯努利分布(bernoulidistribution)又称0-1分布,指一次随机试验,结果只有两种。也就是一个随机变量的取值只有0和1。其中p表示一次伯努利实验中结果为正或为1的概率。概率计算:

    2022年10月12日
    2
  • Python中随机数的生成[通俗易懂]

    Python中随机数的生成[通俗易懂]在Python中可以用于随机数生成的有两种主要途径,一是random模块,另一个是numpy库中random函数。OUTLINErandom模块numpy中的random函数总结random模块random模块中将近有7个函数都是可以用来生成随机数的:①random.random()功能:随机生成一个[0,1)的浮点数用法:importrando…

    2022年10月5日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号