分层抽样不按比例如何加权_按比例分层抽样和定额抽样的区别?

分层抽样不按比例如何加权_按比例分层抽样和定额抽样的区别?从宏观上,两者的目的都是为了提供更好的样本代表性,并且两者的理论基础都来自于:总体的个体的同质性越高,抽样误差越小,样本的代表性越好。两者的本质区别在于是否以概率为基础,比例分层抽样是概率抽样而后者是非概率抽样。从最宏观的角度来说,比例分层抽样产生的样本是随机抽样样本,其本身可以进行抽样误差的评估和推断检验,进而把你样本的结论推广到总体。而定额抽样本身不具备这种可能。从具体操作上,两者都需要选取一…

大家好,又见面了,我是你们的朋友全栈君。

从宏观上,两者的目的都是为了提供更好的样本代表性,并且两者的理论基础都来自于:总体的个体的同质性越高,抽样误差越小,样本的代表性越好。

两者的本质区别在于是否以概率为基础,比例分层抽样是概率抽样而后者是非概率抽样。从最宏观的角度来说,比例分层抽样产生的样本是随机抽样样本,其本身可以进行抽样误差的评估和推断检验,进而把你样本的结论推广到总体。而定额抽样本身不具备这种可能。

从具体操作上,两者都需要选取一定的变量作为分组依据,并且都需要根据各组/总体的数量比例对样本结果进行加权。

但是,分层抽样在确定分层变量之后,对每一个组内需要随机抽样或者等距抽样,这就使得每一个小组中的样本是随机样本,且合并后的样本也是随机样本。而配额抽样则不要求随机抽样,可以使用其他的非概率抽样,比如雪球抽样。第二,关于加权,分层抽样对每个小组的样本数进行控制而配额抽样对subsample size不做要求,仅仅变量的结果上进行加权。

关于两者优劣,分层抽样提供了推断统计的基础。并且尤其随机抽样或者系统抽样的产生,避免了一些外在的偏差。比如,在配额抽样中,看上去友好的人有更高的几率被抽到。但是,很多时候,分层抽样并不具有可能性。比如,在研究边缘群体时,并没有现成的、几乎包括所有组成你研究总体的个体的名单存在,这个时候定额抽样就更适用。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/146603.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 小程序onlaunch和onload(小程序onunload)

    所述问题:前端时间开发了一个微信小程序商城项目,因为这个项目我们的需求是进入小程序就通过wx.login({})这个api进行用户登录,获取系统后台的用户基本信息。再此之前,一直以为微信小程序中的App.js中onLaunch(小程序初始化完成执行该方法)方法比其他页面的的onload方法要先执行。那么问题就来了,我每次进入小程序首页的时候有时候会先执行onlaunch方法,有时又会先执…

    2022年4月14日
    146
  • 无线充qi协议c语言详解,无线充电Qi协议正向通信FSK的解调设计[通俗易懂]

    无线充qi协议c语言详解,无线充电Qi协议正向通信FSK的解调设计[通俗易懂]白光磊池卿华王兆俊江昊史佳雯周天摘要:无线充电Qi协议提出发射器和接收器通过频率调制(FSK)方式进行正向通信,进而建立完整的通信状态控制。接收器可采用测宽法进行频率解调,然而由于电磁耦合变化、负载变化、载波占空比变化、测量量化等引起的误差,该方法无法满足实际应用的要求。该文针对传统测宽法抗干扰能力弱的问题,提出一种窗口滤波算法,通过参考相邻脉冲频…

    2022年6月16日
    47
  • 直插式电阻电容封装与尺寸图…[通俗易懂]

    原文地址:直插式电阻电容封装与尺寸图解作者:北极光直插式无源器件体积普遍要比贴片式要大一些,而且直插式器件在制作PCB时需要打孔,焊接工艺跟贴片式也有差别,较为麻烦,相对而言,直插式电阻电容多是面向大功率电路应用。一、直插式电阻封装及尺寸直插式电阻封装为AXIAL-xx形式(比如AXIAL-0.3、AXIAL-0.4),后面的xx代表焊盘中心间距为xx英寸,这一点在网上很多文章都没说清楚

    2022年4月12日
    467
  • Java抓取网页数据(原网页+Javascript返回数据)

    Java抓取网页数据(原网页+Javascript返回数据)

    2021年12月6日
    44
  • FM &FFM:深入理解FM与FFM「建议收藏」

    FM &FFM:深入理解FM与FFM「建议收藏」0.引言针对类别变量进行oner-hot编码后的高维稀疏矩阵M,可以表示如下:可以看出,经过One-Hot编码之后,大部分样本数据特征是比较稀疏的,One-Hot编码的另一个特点就是导致特征空间大。例如,电影品类有550维特征,一个categorical特征转换为550维数值特征,特征空间剧增。同时通过观察大量的样本数据可以发现,某些特征经过关联之后,与label之间的相关…

    2022年6月3日
    27
  • 智能营销增益模型(Uplift Modeling)的原理与实践

    智能营销增益模型(Uplift Modeling)的原理与实践文章目录增益模型因果与推论(CausalInference)增益模型的表示差分响应模型(Two-ModelApproach)模型优缺点差分响应模型升级版(One-ModelApproach)ClassTransformationMethodClassTransformation的两个假设ModelingUpliftDirectly增益模型的评估uplift柱状图Qini曲线(Qi…

    2025年8月22日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号