数据运营系列(二):如何用合成控制法判断策略实施效果

数据运营系列(二):如何用合成控制法判断策略实施效果1.合成控制法合成控制法最开始是经济学家用来研究评估某个政策实施在某国家或地区的效果,原理即是反事实框架,假想该地区没有受政策干预会怎样,并与事实上受到干预的结果做对比。二者之差即为“…

大家好,又见面了,我是你们的朋友全栈君。

1. 合成控制法

合成控制法最开始是经济学家用来研究评估某个政策实施在某国家或地区的效果,原理即是反事实框架,假想该地区没有受政策干预会怎样,并与事实上受到干预的结果做对比。二者之差即为“处理效应”。这里D为干预变量,X为解释变量,Y为被解释变量。因此合成控制法需要估计处理效应ATT: 

数据运营系列(二):如何用合成控制法判断策略实施效果

那么如何求解未受政策干预的结果呢?常用的解决方法就是寻找适当的控制组,即从其他相似的地区来组合成一个新的地区,新地区和实际受干预的地区一致。比如,要评估仅在A市实施的某政策效果,用其他城市(B市、C市、D市)进行适当的线性组合构成A市的控制组,即合成的A市 ,最后比较这个合成的A市和真实的A市在某一结果指标上的差别。

作为因果推断方法之一,合成控制法的特点主要是原理简单、并且结果合理有说服力,可视化强。

2. 策略实施效果评估

比如某一业务线一直用户规模稳健上升,为实现快速用户增长,在经费有限的情况下,运营方决定尝试在2019年10月北京这一地区投放某一广告持续一个月,如果效果显著,再统一推广到全国各地。那么这里如何评估效果?这一广告是否需要推广到全国?像这样的场景又无法使用AB testing等实验方法,那么从数据驱动运营的角度分析,观察研究比较适用于该场景分析,这里选用合成控制法,该方法能更好地将结果可视化为运营人员呈现。假设该业务的销售情况基本不随季节有较大变动。

数据集说明:

  • time:时间变量,年月

  • area:地区

  • age15to24:年龄在15到24岁的用户比例

  • male:男性用户比例

  • tenant:租房用户比例

  • income:人均收入

  • sale_amount:人均购买量

  • user_amount:用户渗透率

合成控制法的流程: 

  • 确定结果变量,这里以用户渗透率为预测变量

  • 确定预测变量,这里包括age15to24(年龄在15到24岁的用户比例,年轻人为用户目标对象)、male(男性用户比例,男性为目标用户)、tenant(租房用户比例,租房者为目标用户)、income(人均收入)、sale_amount(人均产品购买量)

  • 确定用于合成对照组的个体,这里将其他城市作为合成对照组的个体

  • 确定权重,通常算法是最小化预测均方误差

  • 检验拟合,即干预前一段时间内控制组和干预组因变量是否接近

  • 检验安慰剂效应

  • 检验稳健性

分析结果:

通过合成控制法分析结果发现,用于拟合北京市的城市由上海市、重庆市和广东省组成,权重占比分别为0.54,0.32和0.14。其余城市权重为0。进一步考察北京市与合成北京市的预测变量是否接近。

表1 预测变量均值比较

变量 北京市 合成北京市
age15to24 0.207 0.191
male 0.502 0.511
tenant 0.445 0.432
income 0.661 0.661
sale_amount 0.428 0.427

在表1中,比较了实际的北京市和合成的北京市的预测变量均十分接近,故合成北京市可以很好地复制北京市的市场特征。然后比较二者的结果变量上的差异:

数据运营系列(二):如何用合成控制法判断策略实施效果

图1 合成控制法分析结果

上图显示了北京市和合成北京市在2019年1月-2020年3月期间的用户渗透率。高程度的拟合表明,在广告实施之前,合成北京市的用户渗透率与真实北京市几乎重合,表明合成北京市可以很好地作为北京市的反事实替身。上图表明广告实施对用户渗透率有很大影响,这种效应随着时间的推移而增强。我们的结果表明,对于整个2019年10月到2020年3月期间的用户渗透率提高了近20%,但对比自然增长效果,广告带来的用户渗透率幅度不大,比如在2020年1月提高了近3.6%。广告所带来的用户增长只占18%(3.6%/20%),单从数据层面的来看,效果并不明显,因此不建议推广。

3. 学习资料

PPT推荐:合成控制法(Synthetic Control Method)(附PPT免费公开)

视频资料:合成控制法视频资源(一)

点击“在看”可收藏随时查看↘↘↘

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/134588.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • win11游戏性能提升_win10怎么设置显卡高性能

    win11游戏性能提升_win10怎么设置显卡高性能其实打造一款高性能系统主要要做到以下三点:一、安装纯净的原版系统。二、打开系统的高性能模式,对部分设置进行优化。三、养成良好的使用习惯,在安装软件时,避免某些引起系统卡顿的软件和全家桶、广告软件。安装完纯净版的windows11系统后,可以进行一下的设置优化:一、切换高性能电源计划二、调整性能选项三、调整隐私安全常规设置四、调整隐私安全诊断和反馈设置五、关闭隐私安全搜索权限六、关闭游戏模式七、任务栏设置一、切换高性能电源计划打开系统“开始菜单->所有应用->windows工具

    2022年9月20日
    4
  • 面向对象的学生信息管理系统_java面向对象学生管理系统

    面向对象的学生信息管理系统_java面向对象学生管理系统面向对象版-学员管理系统目标一.系统需求二.准备程序文件2.1分析2.2创建程序文件三.书写程序3.1student.py3.1.2程序代码3.2managerSystem.py3.2.1定义类3.2.2管理系统框架3.3main.py3.4定义系统功能函数3.4.1添加功能3.4.2删除学员3.4.3修改学员信息3.4.5查询学员信息3.4.6显示所有学员信息3.4.7保存学员信息3.4.8加载学员信息四.总结目标了解面向对象开发过程中类内部功能的分析方法了

    2022年9月20日
    3
  • bitblt函数_统计参数的含义

    bitblt函数_统计参数的含义【转载请注明出处: http://blog.csdn.net/lzl124631x】接口BOOLBitBlt( _In_ HDChdcDest, _In_ intnXDest, _In_ intnYDest, _In_ intnWidth, _In_ intnHeight, _In_ HDChdcSrc, _I

    2022年10月19日
    4
  • RGBD深度相机_rgbd相机是什么

    RGBD深度相机_rgbd相机是什么深度相机与RGBD相机的区别?为何经常概念混淆?什么是深度图? 什么是深度/RGB-D相机(有什么关系?)? RGB-D相机原理简介结构光 飞行时间RGB-D相机有哪些坑? RGB-D相机优点 RGB-D相机应用深度图一般是16位的单目结构光?双目结构光?单目结构光有一个红外发射器和一个红外接收器双目结构光有一个红外发射器和两个红外接收器…

    2022年9月18日
    3
  • 常用存储器分类

    常用存储器分类1 存储器是计算机实现记忆功能的部件 用来存放程序和数据 是微机系统中重要的组成部分 存储器的容量越大 表明能存储的信息越多 计算机的处理能力也就越能充分展现 存储器系统由外存储器和内存储器两部分组成 其中内存储器用来存放当前运行的程序和数据 一般由一定容量的速度较高存储器组成 CPU 可直接用指令对内存储器进行读 写操作 内存储器的分类如下 2 RAM RandomAccess

    2025年8月13日
    10
  • python3 gil锁_python gil 多线程

    python3 gil锁_python gil 多线程前言python的使用者都知道Cpython解释器有一个弊端,真正执行时同一时间只会有一个线程执行,这是由于设计者当初设计的一个缺陷,里面有个叫GIL锁的,但他到底是什么?我们只知道因为他导致pyt

    2022年8月7日
    8

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号