决策树（CART）

全栈程序员-站长 • 2021年11月19日下午12:00 • 未分类 • 阅读 53

决策树（CART）

CART算法全称是分类回归算法，（Classification And Regression Tree），他与ID3、C4.5的不同在于：

1、既可以处理分类问题又可以处理回归问题

2、使用基尼系数作为分类依据，比起使用熵计算简单

3、使用的是二分递归分割的技术，生成二叉树

原理不在赘述，基尼系数计算公式：

<span>决策树（CART）</span>

其中，A表示某一属性，C表示这个属性下共C种特征，Pi表示第i个特征发生的概率

当然，对于公式解释的有点乱，很容易搞混，下面结合实例介绍如何计算：

<span>决策树（CART）</span>

对于上面的属性，基尼系数计算如上所示。

对于信息增益的计算为：Gain(house) = Entropy(S) – 3/10*Entropy(has)-7/10*Entropy(nothas)

Entropy(S) = -3/10*log(3/10)-7/10*log(7/10)

Entropy(has) = 0

Entropy(nothas) = -3/7*log(3/7)-4/7*log(4/7)

说白了，基尼系数和熵一样，也是衡量一个事件的不确定度。

故节点选择小的基尼系数的属性

对于Python代码，利用sklearn模块通常可以实现，

#   这里不写输入X和Y了，对应的例子有问题，待解决
from sklearn import tree
from sklearn.externals.six import StringIO
import pydotplus


clf = tree.DecisionTreeClassifier(criterion = 'gini')#算法模型

clf = clf.fit(X, Y)#模型训练
dot_data = StringIO()
tree.export_graphviz(clf, out_file=dot_data)
graph = pydotplus.graph_from_dot_data(dot_data.getvalue())
graph.write_pdf("test.pdf")#写入pdf

　　基本的程序如上，但是对于CART算法，输入的特征需要是实数，在这里需要进一步研究，有问题，待解决！！！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/119482.html原文链接：https://javaforall.net

赞 (0)

全栈程序员-站长

0 0

java 面试题详解（转自传智播客张孝祥老师）

java 面试题详解（转自传智播客张孝祥老师）张孝祥正在整理 Java 就业面试题大全每天进步一点点 CSDN 博客 2011 年 11 月 24 日星期四设为主页加入收藏帮助留言交流登录首页阅览室馆友我的图书馆张孝祥正在整理 Java 就业面试题大全每天进步一点点 CSDN 博客转载 asdfg 收藏于

全栈程序员-站长
2025年8月24日
4
window.location.Reload()和window.location.href 区别

window.location.Reload()和window.location.href 区别

全栈程序员-站长
2021年10月31日
47
罗技键盘+android风格,罗技这款好看轻便的蓝牙键盘，让你在电脑手机间无缝切换…

罗技键盘+android风格,罗技这款好看轻便的蓝牙键盘，让你在电脑手机间无缝切换…来源：极客之选摘要对便携性和颜值有要求的用户，这款键盘很适合。罗技K380蓝牙键盘是罗技比较经典的一款外设产品，最近，罗技新推出了k380芍药白和茱萸粉两种新配色，让我们来一起看一下。其中粉色介于粉色和裸色之间，相比粉色增加了一丝灰色。极客之选本次拿到的是白色版本，颜色也非亮白，而是与粉色类似较柔和，两种颜色整体都非常素雅，因此也适合在各种场合使用。外观上，罗技K380延续了一贯的设计…

全栈程序员-站长
2022年10月15日
5
elementUI 时间格式化

elementUI 时间格式化1.html:<el-table-columnprop=”dateTime”:formatter=”dateFormat”label=”日期”></el-table-column>2.vue的methods里面//方法methods:{//时间格式化dateFormat(row,colum…

全栈程序员-站长
2022年5月20日
49
java编写定时程序_java编辑器

java编写定时程序_java编辑器Java定时器代码的编写在某些时候,我们需要实现这样的`功能,某一程序隔一段时间执行一次,而这一事情由系统本身来完成,并不是人为的触发,我们一般可称此为定时器任务.其实到Java中,实现起来是非常简单的,下面我们以每隔5秒钟打引一句”Helloworld”为例：importjava.util.TimerTask;publicclassTimeTastextendsTimerTask…

全栈程序员-站长
2025年12月15日
6
zTree实现地市县三级级联DAO接口实现[通俗易懂]

zTree实现地市县三级级联DAO接口实现

全栈程序员-站长
2022年2月3日
47

发表回复

关注全栈程序员社区公众号