【Uplift】评估方法篇

【Uplift】评估方法篇https zhuanlan zhihu com p 文章目录线上评估方法离线评估方法 Upliftdecile gainUpliftCu amp AUUCQiniCurv amp QiniCoeffici 补充 AUUC 和 Qini 的另一种口径和标准的预测方法不同 由于 反事实 的存在 并没有真实的 uplift 标签 因此 uplift 模型无法在样本维度上进行评估 但如果有随机试验采集的数据 则可以用平均水平来评

和标准的预测方法不同,由于”反事实“的存在,并没有真实的uplift标签,因此uplift模型无法在样本维度上进行评估。但如果有随机试验采集的数据,则可以用平均水平来评估uplift模型的效果。

本文将分为线上评估和离线评估两部分介绍,其中线上评估主要是AB策略;离线评估是AUUC、Qini等。

线上评估方法

最好的验证模型或策略效果的方法就是做线上的AB实验。在设计AB实验对比时,要小心处理目标的数据范围,在什么节点进行分流。

如果我们想知道的是全局的策略效果,则要在一开始就分流;而如果想知道策略生效部分的效果,则要在策略判定之后,对判定生效的部分进行分流,其中A桶原样返回,B桶生效返回。

下面是腾讯广告做uplift分析的流程图示例,通过线上AB试验的方式给出增量效果。

在这里插入图片描述

离线评估方法

线上评估虽然准确,但我们也需要具备离线评估的能力,避免浪费线上流量。与线上评估看整体的增量不同,离线评估需要能支持模型的效果对比。

离线评估方法有很多种,都需要对数据做分组(或累积)。将所有样本按照模型给出的uplift得分降序排列,按照等比分为K组(bins),后续的效果评估则通过对比相应组内Treatment组和Control组的得分差异实现。

Uplift decile charts

用第k组内Treatment和Control样本的 y ˉ \bar{y} yˉ之差表示,如下图表示按照uplift得分降序排列后,前50%的样本Treatment是正效果的,而后50%是负效果。

该方法虽然直观,但很难用于进行模型间的对比,如难以说明下面两个模型的优劣。

在这里插入图片描述

Cumulative uplift/gain

Cumulative uplift:通过计算topK组内Treatment和Control组的 y ˉ \bar{y} yˉ差值,可以表达在topK组得分的数据内,增量效果如何。如左图。

Cumulative gain:一些场景中,我们需要的不只是按照”uplift“选中部分的效果,而需要的是根据”uplift“来决策是Treat还是Control之后,能够带来的增量绝对量有多少。如右图,此时选择最高点即为最佳效果,再往后的实际是Control组优于Treatment组的部分。

公式如下, Y Y Y表示分组正例数量, N N N表示分组总量, ⋅ T \cdot^T T表示Treatment组, ⋅ C \cdot^C C表示Control组。
( Y T N T − Y C N C ) ( N T + N C ) \left(\frac{Y^{T}}{N^{T}}-\frac{Y^{C}}{N^{C}}\right)\left(N^{T}+N^{C}\right) (NTYTNCYC)(NT+NC)

在这里插入图片描述

Uplift Curve & AUUC

曲线中,越高拱的模型效果越好,数值化表示的话可以使用曲线下面积,与二分类评估中的AUC(Area Under ROC Curve)类似。这里称为AUUC(Area Under Uplift Curve),即 ∑ t N f ( t ) \sum_t^N f(t) tNf(t)

在这里插入图片描述

Qini Curve & Qini Coefficient

另外,取Qini曲线先面积为Qini系数。

在这里插入图片描述

补充,AUUC和Qini的另一种口径

前述的AUUC和Qini系数取自综述论文,CausalML的复现是基于这种的。在另一篇更新的论文中,明确提到了AUUC和Qini系数的计算公式,更复杂,似乎更合理,可以参考选用。其中的”uplift“部分当k取N时,实际上与前述的相同。

AUUC

下图展示了一个Uplift曲线(这里目测除以总量了)

则AUUC定义为Uplift曲线和Baseline的曲线下面积差。第一项表示uplift曲线下面积,用累积求和表示;第二项表示baseline曲线下面积,用三角形面积公式表示。

在这里插入图片描述

其中 A U U C π ( k ) AUUC_\pi(k) AUUCπ(k)表示前k个样本计算得到的AUUC原子, A U L AUL AUL表示Area Under Lift, R π ( k ) = ∑ d i ∈ π ( k ) 1 [ y i = 1 ] R_{\pi}(k)=\sum_{d_{i} \in \pi(k)} \mathbb{1}\left[y_{i}=1\right] Rπ(k)=diπ(k)1[yi=1]表示前k个样本中的正例数, R ˉ ( k ) = k ⋅ E [ Y ∣ T ∈ { 1 , 0 } ] \bar{R}(k)=k\cdot \mathbb{E}[Y|T\in\{1,0\}] Rˉ(k)=kE[YT{
1,0}]
表示前k个样本中的平均正例数。

取AUUC值为各个原子的均值,如下:

在这里插入图片描述

在这里插入图片描述

Qini coefficient

Qini系数是Gini系数的一般化形式,与AUUC计算类似。首先由Qini曲线如下图,其中x轴表示数量,y轴表示增量数量。Qini原子的公式如下

在这里插入图片描述

公式的第一部分同上述的Qini曲线,是对以Treatment为标准做了缩放。第二部分用三角形面积公式计算,表示随机排序的结果。另外,如下图所示,best model表示理想情况下的曲线形式,从0开始,首先是45°提升(表示T组选中正例,而C组均是反例),接着是水平线(表示T组C组都是反例),最后45°下降(表示T组选中反例,而C组均是正例)。

此时,Qini系数如下,其中 π ∗ \pi^* π表示最优的排序。

在这里插入图片描述

另外,本文介绍了Qini系数相对AUUC的好处:①Qini系数做了T组和C组的样本缩放,解决AUUC在T组比C组多很多时不适用的问题;②Qini系数是归一化后的,这样它就可以在不同的数据集间做一个对比。

在这里插入图片描述

参考文献

[1]Causal Inference and Uplift Modeling A review of the literature

[2]A Large Scale Benchmark for Uplift Modeling

[3]更多参考:https://zhuanlan.zhihu.com/p/


版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/225311.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月17日 上午9:36
下一篇 2026年3月17日 上午9:36


相关推荐

  • 重磅消息!即梦创作Agent来袭,内测申请及玩法大揭秘!

    重磅消息!即梦创作Agent来袭,内测申请及玩法大揭秘!

    2026年3月12日
    2
  • LaTeX(4)——LaTeX插入图片「建议收藏」

    LaTeX(4)——LaTeX插入图片「建议收藏」转载请注明作者和出处:https://blog.csdn.net/qq_28810395运行平台:Windows10环境加编译器:Texlive2020+Texstudio编辑器如有需要IEEE模板文件的可以关注Stefan0704回复IEEE进行获取。前言  在Paper的排版中,对于图片的排版也是重点之一,一篇好的Paper,图片排版的不规范,直接决定了读者对Paper的第一印象,所以下面分享一下图片排版方法。排版方式图片的插入很简单呢,一般就是如下述的代码与结果所示,插入.

    2022年5月18日
    33
  • 深度解析:Claude Code 和 OpenClaw 底层架构的设计取舍

    深度解析:Claude Code 和 OpenClaw 底层架构的设计取舍

    2026年3月14日
    4
  • ASP.NET项目开发详解

    ASP.NET项目开发详解#ASP.NET项目开发详解###1ASP.NET开发基础####1.1认识网页和网站#####1.1.1网页#####1.1.2网站####1.2网站开发基础#####1.2

    2022年7月1日
    36
  • fragstats移动窗口

    fragstats移动窗口在使用 fragstats 制作移窗图时 移窗大小的选取是一件令人困扰的事情 下面我就谈一谈移窗及其大小的选取 如有错漏 欢迎指正 首先 先来了解一下移窗的工作机制 设定窗口大小 勾选所要计算的景观指数 运行程序启动后 窗口会从图像左上角开始从左向右一个像元一个像元的移动 移动过程中窗口范围内的景观指数会被计算出来并赋值在最中心的像元 最终生成的移窗图会比原来的图小 移窗大小的选取是很重要的

    2026年3月17日
    2
  • 哔哩哔哩如何提取封面_如何提取封面

    哔哩哔哩如何提取封面_如何提取封面经常看到小伙伴们要封面 正巧上次看到一位大佬发了一个能提取封面的 就分享给大家了 好东西 拿着 https b23 tv jKWtMbhttp galmoe com https u nu tzp3https m baidu com from a bd page type 1 ssid 0 uid 0 pu usm 403 2Csz 40320 1001 2Cta 40i

    2026年3月19日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号