python stacking_详解 Stacking 的 python 实现[通俗易懂]

1.什么是stackingstacking就是当用初始训练数据学习出若干个基学习器后,将这几个学习器的预测结果作为新的训练集,来学习一个新的学习器。2.代码:例如我们用RandomForestClassifier,ExtraTreesClassifier,GradientBoostingClassifier作为第一层学习器:#Ourlevel0classifiersclfs…

大家好,又见面了,我是你们的朋友全栈君。

1. 什么是 stacking

stacking 就是当用初始训练数据学习出若干个基学习器后,将这几个学习器的预测结果作为新的训练集,来学习一个新的学习器。

5905f19c4df6

2. 代码:

例如我们用 RandomForestClassifier, ExtraTreesClassifier, GradientBoostingClassifier 作为第一层学习器:

# Our level 0 classifiers

clfs = [

RandomForestClassifier(n_estimators = n_trees, criterion = ‘gini’),

ExtraTreesClassifier(n_estimators = n_trees * 2, criterion = ‘gini’),

GradientBoostingClassifier(n_estimators = n_trees),

]

接着要训练第一层学习器,并得到第二层学习器所需要的数据,这里会用到 k 折交叉验证。

1. 先用初始训练集训练 clf,并得到第二层的训练数据 blend_train:

第 j 个学习器,共经过 nfolds 次交叉验证,每一次会得到当前验证集角标上的预测值,nfolds 之后得到和初始训练集一样大小的集合:

blend_train[cv_index, j] = clf.predict(X_cv)

5905f19c4df6

2. 再用 clf 对 test 集进行预测,来得到第二层的测试数据 blend_test:

即每个第一层学习器在每次 fold 时,用学习器对初识测试集进行预测,n 次之后,对所有结果取平均值,得到第 j 个学习器在测试集上的预测结果:

blend_test_j[:, i] = clf.predict(X_test)

blend_test[:, j] = blend_test_j.mean(1)

5905f19c4df6

这样第一层的每个学习器,都会得到一列训练数据和一列测试数据为第二层的学习器所用。

# For each classifier, we train the number of fold times (=len(skf))

for j, clf in enumerate(clfs):

print ‘Training classifier [%s]’ % (j)

blend_test_j = np.zeros((X_test.shape[0], len(skf))) # Number of testing data x Number of folds , we will take the mean of the predictions later

for i, (train_index, cv_index) in enumerate(skf):

print ‘Fold [%s]’ % (i)

# This is the training and validation set

X_train = X_dev[train_index]

Y_train = Y_dev[train_index]

X_cv = X_dev[cv_index]

Y_cv = Y_dev[cv_index]

clf.fit(X_train, Y_train)

# This output will be the basis for our blended classifier to train against,

# which is also the output of our classifiers

blend_train[cv_index, j] = clf.predict(X_cv)

blend_test_j[:, i] = clf.predict(X_test)

# Take the mean of the predictions of the cross validation set

blend_test[:, j] = blend_test_j.mean(1)

3. 接着用 blend_train, Y_dev 去训练第二层的学习器 LogisticRegression:

# Start blending!

bclf = LogisticRegression()

bclf.fit(blend_train, Y_dev)

blend_train = np.zeros((X_dev.shape[0], len(clfs))),这个集合是有几个学习器就有几列:

5905f19c4df6

4. 再用 bclf 来预测测试集 blend_test,并得到 score:

# Predict now

Y_test_predict = bclf.predict(blend_test)

score = metrics.accuracy_score(Y_test, Y_test_predict)

print ‘Accuracy = %s’ % (score)

blend_test = np.zeros((X_test.shape[0], len(clfs))),也是有几个学习器就有几列:

5905f19c4df6

整体流程简图如下:

5905f19c4df6

推荐阅读 历史技术博文链接汇总

http://www.jianshu.com/p/28f02bb59fe5

也许可以找到你想要的:

[入门问题][TensorFlow][深度学习][强化学习][神经网络][机器学习][自然语言处理][聊天机器人]

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/126552.html原文链接:https://javaforall.net

(0)
上一篇 2022年4月8日 下午12:00
下一篇 2022年4月8日 下午12:20


相关推荐

  • OpenCV里IplImage的widthStep参数 和width参数

    OpenCV里IplImage的widthStep参数 和width参数前者是表示图像的每行像素数,后者指表示存储一行像素需要的字节数。在OpenCV里边,widthStep必须是4的倍数,从而实现字节对齐,有利于提高运算速度。如果8U单通道图像宽度为3,那么widthStep是4,加一个字节补齐。这个图像的一行需要4个字节,只使用前3个,最后一个空着。也就是一个宽3高3的图像的imageData数据大小为4*3=12字节。

    2022年5月24日
    67
  • 短视频解析接口搭建_小程序 开发文档

    短视频解析接口搭建_小程序 开发文档接口开发文档去水印接口请求地址:https://api.srvv.cn/api/video/32AFD1F6A24A3A49921AB80AE1C58035ED01CC5DF282B23D79/2/?url={短视频链接,记住是纯链接}接口申请地址:api.srvv.cn请求方式:GET返回格式:JSON请求参数说明:字段必填类型说明url是String短视频分享的URL返回参数说明:…

    2022年10月3日
    4
  • Pycharm安装matplotlib后出现问题,找到问题出现的原因,分享给各位

    Pycharm安装matplotlib后出现问题,找到问题出现的原因,分享给各位还记得之前我给大家分享的一篇文章吗 因为后面可能会使用到不同版本的 Python 因此我们一般会采用虚拟环境安装软件 安装步骤和说明参考链接 创建虚拟环境于是我就装了一些常见的软件 同时我的电脑里面还有一个 anaconda 这个也有很多库安装成功 但是今天我在 pycharm 中打开后 使用 matpolt 总是出错 一开始没有安装 于是我在 pycharm 的终端中安装了 pipinstallma 提示我安装成功 但是运行起来总是报错 告诉我缺少什么插件 网上别人告诉我是先卸载再安装 然而并没卵用 最后

    2026年3月27日
    2
  • 关于2的补码

    关于2的补码from http www ruanyifeng com blog 2009 08 twos complement html 问一个基本的问题 负数在计算机中如何表示 举例来说 8 在计算机中表示为二进制的 1000 那么 8 怎么表示呢 很容易想到 可以将一个二进制位 bit 专门规定为符号位 它等于 0 时就表示正数 等于 1 时就表示负数 比如 在 8 位机中 规定每个字节的最高位

    2026年3月26日
    2
  • nbsp啥意思_UG拆分体

    nbsp啥意思_UG拆分体转载:http://blog.csdn.net/olei_oleitao/article/details/7919307 一、DM36X的BOOT过程介绍DM36x的BOOT过程和DM6446、DM6467完全是一样的,因为都是ARM926EJS架构,里边都有一个RBL,这RBL在芯片出厂的时候都烧写在ROM里,芯片上电复位后RBL在运行,然后读取BOOTMODE引脚的电平状态,决定

    2022年8月13日
    6
  • 由生产者/消费者问题看JAVA多线程

    由生产者/消费者问题看JAVA多线程

    2021年5月6日
    122

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号