决策树模型的用途_决策树模型怎么建立

决策树模型的用途_决策树模型怎么建立概念定义在特征空间与类空间上的条件概率分布,即给定特征条件下类的条件概率分布;也可以认为是if-then规则的集合优点模型具有可读性,分类速度快。模型首先,介绍一下决策树模型:由结点和有向边组成,结点又可分为内部结点和叶结点。内部结点表示一个特征或属性,叶结点表示一个类。决策树与条件概率分布决策树所表示的条件概率分布由各个单元给定条件下的类的条件概率分布组成。若X表…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

概念

定义在特征空间与类空间上的条件概率分布,即给定特征条件下类的条件概率分布;也可以认为是if-then规则的集合

优点

模型具有可读性,分类速度快。

模型

首先,介绍一下决策树模型:

结点有向边组成,结点又可分为内部结点叶结点内部结点表示一个特征或属性叶结点表示一个

决策树与条件概率分布

决策树所表示的条件概率分布由各个单元给定条件下的类的条件概率分布组成。若X表示特征的随机变量,取值于给定划分下单元的集合,Y表示类的随机变量,取值于类的集合,则该条件概率分布可以表示为P(Y|X)。

各叶结点(单元)上的条件概率往往偏向于某一类,即属于某一类的概率较大。

决策树本质

从训练数据集中归纳出一组分类规则。

步骤

决策树的学习常包含三个步骤:

特征选择

决策树的生成

决策树的剪枝

特征选择

是决定用哪个特征来划分特征空间。三种方法:

信息增益

信息增益比

基尼指数

决策树的生成

基本方法,从根结点出发,对结点计算所有可能的特征的信息增益(或信息增益比或基尼指数),选择信息增益值(或信息增益比或基尼指数)较大的特征作为结点的特征。

几种选择标准的不同(ID3, C4.5, CART)可参考:决策树

决策树的剪枝

通过极小化决策树整体的损失函数或代价函数来实现。

两者的不同:

决策树的生成只考虑了通过提高信息增益或信息增益比对数据进行更好的拟合,而剪枝通过优化损失函数还减小了模型的复杂度。

决策树生成学习局部的模型,而决策树剪枝学习整体的模型。

 

 

 

 

 

 

 

 

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/179599.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 如何配置IIS运行 ASPX「建议收藏」

    如何配置IIS运行 ASPX「建议收藏」如何配置IIS运行ASPX最近在做.ASPX搞了好一阵子,才弄懂这个东西,和大家分享……欢迎讨论一、先注册asp.net组件:(asp.NET组件即:.NetFramework)开始->运行->cmd->执行命令:C:\windows\Microsoft.NET\Framework\v2.0.50727\aspnet_regiis.exe-i(你的.net组件…

    2025年5月26日
    2
  • sqlSessionTemplate的优点

    sqlSessionTemplate的优点sqlSessionTemplate的优点 1.sqlSessionTemplate里面有一个sqlSessionProxy,可以使用动态代理 2.正因为动态代理,invoke方法里面会根据是否是事务,获取相同或不同的sqlSession,最后这个sqlSession去执行目标方法和关闭这个sqlSession 这样可以符合spring单例的特点,为不同的事务或conn,创建不同的sqlSession 如果直接在spring中注册一个sqlSession,那么不同连接都获得相

    2022年5月29日
    32
  • 5G网络切片综述 — 1

    5G网络切片综述 — 1简介随着5G时代的来临,21年的SA在国内的全范围商用,现阶段人们对于5G的必要性认识还不足。主要是目前人们用的5G主要集中在eMBB(enhancedMobileBroadband)即增强型移动带宽的阶段,而大数据业务如在线直播、高清视频等在4G上都得到了很好的支持,所以带宽的继续增大对于用户体验的边际效应递减。5G所带来的真正改善并不仅仅是在于大带宽,而在于5G提供了在同一张物理5G网络的情况下,同时能够提供eMBB,URLLC(Ultra-ReliableLow-LatencyCommun

    2022年10月2日
    2
  • SMO算法笔记及个人理解

    SMO算法笔记及个人理解SMO算法介绍SMO算法是一种启发式算法,其基本思路是:如果所有变量的解都满足此优化问题的KKT条件,那么这个最优化问题的解就得到了。(KKT条件是该最优化问题的充分必要条件)。否则,选择两个变量,固定其他变量针对这两个变量构建一个二次规划问题。特点:将原始的二次规划问题分解为只含有两个变量的二次规划子问题,对子问题不断求解,使得所有的变量满足KKT条件包含两部分:1、求解两个变量二次规划的解析方法2、选择变量的启发式方法(1)第1个变量的选择:确定在当前的分类器中,违反K.

    2022年6月22日
    36
  • 添加了ValidateRequest=”false”仍然报错的解决办法[通俗易懂]

    添加了ValidateRequest=”false”仍然报错的解决办法[通俗易懂]在文本框传递HTML代码时默认是不允许的,会提示有潜在危险字符,只要在页头的指令中加ValidateRequest=”false”就可以解决,如下所示:或查看配置文件中是否有同样的设置,如:若上述操作后仍然报错,可在配置文件中加入节如下:

    2022年6月9日
    32
  • java创建文件和目录

    java创建文件和目录创建文件和目录的关键技术点如下:1、File类的createNewFile根据抽象路径创建一个新的空文件,当抽象路径制定的文件存在时,创建失败2、File类的mkdir方法根据抽象路径创建目录3、File类的mkdirs方法根据抽象路径创建目录,包括创建必需但不存在的父目录4、File类的createTempFile方法创建临时文件,可以制定临时文件的文件名前

    2022年6月18日
    27

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号