高级算法梳理（三）XGB算法

全栈程序员-站长 • 2026年3月17日上午8:32 • 未分类 • 阅读 2

算法原理

XGBoost（eXtreme Gradient Boosting）是工业界逐渐风靡的基于GradientBoosting算法的一个优化的版本，可以给预测模型带来能力的提升。其算法思想就是不断地添加树，不断地进行特征分裂来生长一棵树，每次添加一个树，其实是学习一个新函数，去拟合上次预测的残差。当我们训练完成得到k棵树，我们要预测一个样本的分数，其实就是根据这个样本的特征，在每棵树中会落到对应的一个叶子节点，每个叶子节点就对应一个分数，最后只需要将每棵树对应的分数加起来就是该样本的预测值。

注：w_q(x)为叶子节点q的分数，f(x)为其中一棵回归树

损失函数

对于回归问题，我们常用的损失函数是MSE，即：

对于分类问题，我们常用的损失函数是对数损失函数：

XGBoost目标函数定义为：

同时，可以将目标函数改写成：

很明显，我们接下来就是要去找到一个f_t能够最小化目标函数。XGBoost的想法是利用其在f_t=0处的泰勒二阶展开近似它。所以，目标函数近似为：

其中g_i为一阶导数，h_i为二阶导数：

由于前t-1棵树的预测分数与y的残差对目标函数优化不影响，可以直接去掉。简化目标函数为：

上式是将每个样本的损失函数值加起来，我们知道，每个样本都最终会落到一个叶子结点中，所以我们可以将所以同一个叶子结点的样本重组起来，过程如下图：

因此通过上式的改写，我们可以将目标函数改写成关于叶子结点分数w的一个一元二次函数，求解最优的w和目标函数值就变得很简单了，直接使用顶点公式即可。因此，最优的w和目标函数公式为：

正则化

xgboost使用了如下的正则化项：

这里出现了γ和λ，这是xgboost自己定义的，在使用xgboost时，你可以设定它们的值，显然，γ越大，表示越希望获得结构简单的树，因为此时对较多叶子节点的树的惩罚越大。λ越大也是越希望获得结构简单的树。

对缺失值处理

xgboost模型能够处理缺失值，模型允许缺失值存在。关于缺失值的处理将其看与稀疏矩阵的处理看作一样。在寻找split point的时候，不会对该特征为missing的样本进行遍历统计，只对该列特征值为non-missing的样本上对应的特征值进行遍历，通过这个技巧来减少了为稀疏离散特征寻找split point的时间开销。在逻辑实现上，为了保证完备性，会分别处理将missing该特征值的样本分配到左叶子结点和右叶子结点的两种情形，计算增益后选择增益大的方向进行分裂即可。可以为缺失值或者指定的值指定分支的默认方向，这能大大提升算法的效率。如果在训练中没有缺失值而在预测中出现缺失，那么会自动将缺失值的划分方向放到右子树。

优缺点

优点：

sklearn参数

（1）objective [ default=reg:linear ] 定义学习任务及相应的学习目标，可选的目标函数如下：

本篇为转载

原文链接：https://blog.csdn.net/weixin_/article/details/

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/225794.html原文链接：https://javaforall.net

高级算法梳理（三）XGB算法

关于作者

全栈程序员-站长

发表回复

高级算法梳理（三）XGB算法

关于作者

全栈程序员-站长

相关推荐

Android 结合实例学会AsyncTask的使用方法

JNZ是什么指令_pushf指令

电商新宠—广告电商，转化产品的流量聚体地「建议收藏」

16天记住7000考研单词

currentStyle

SEH学习

发表回复