统计学中的Bootstrap方法(Bootstrap抽样)

统计学中的Bootstrap方法(Bootstrap抽样)Bootstrap 又称自展法 自举法 自助法 靴带法 是统计学习中一种重采样 Resampling 技术 用来估计标准误差 置信区间和偏差 Bootstrap 是现代统计学较为流行的一种统计方法 在小样本时效果很好 机器学习中的 Bagging AdaBoost 等方法其实都蕴含了 Boostrap 的思想 在集成学习的范畴里 Bootstrap 直接派生出了 Bagging 模型子样本之于样本 可以类比样本之于总体举例栗子 我要统计鱼塘里面的鱼的条数 怎么统计呢 假设鱼塘总共有鱼 10

      Bootstrap又称自展法、自举法、自助法、靴带法 ,  是统计学习中一种重采样(Resampling)技术,用来估计标准误差、置信区间和偏差

子样本之于样本,可以类比样本之于总体

举例

栗子:我要统计鱼塘里面的鱼的条数,怎么统计呢?假设鱼塘总共有鱼1000条,我是开了上帝视角的,但是你是不知道里面有多少。

步骤

1. 承包鱼塘,不让别人捞鱼(规定总体分布不变)。
2. 自己捞鱼,捞100条,都打上标签(构造样本)
3. 把鱼放回鱼塘,休息一晚(使之混入整个鱼群,确保之后抽样随机)
4. 开始捞鱼,每次捞100条,数一下,自己昨天标记的鱼有多少条,占比多少(一次重采样取分布)。
5. 重复3,4步骤n次。建立分布。



(原理是中心极限定理)

       假设一下,第一次重新捕鱼100条,发现里面有标记的鱼12条,记下为12%,放回去,再捕鱼100条,发现标记的为9条,记下9%,重复重复好多次之后,假设取置信区间95%,你会发现,每次捕鱼平均在10条左右有标记,所以,我们可以大致推测出鱼塘有1000条左右。其实是一个很简单的类似于一个比例问题。这也是因为提出者Efron给统计学顶级期刊投稿的时候被拒绝的理由–“太简单”。这也就解释了,为什么在小样本的时候,bootstrap效果较好,你这样想,如果我想统计大海里有多少鱼,你标记条也没用啊,因为实际数量太过庞大,你取的样本相比于太过渺小,最实际的就是,你下次再捕的时候,发现一条都没有标记,就尴尬了。。。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/177666.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月26日 下午6:59
下一篇 2026年3月26日 下午6:59


相关推荐

  • 零是奇数还是偶数?

    零是奇数还是偶数?

    2021年10月17日
    142
  • 剑指 Offer:Redis 的 14 大使用场景!

    剑指 Offer:Redis 的 14 大使用场景!

    2022年2月11日
    59
  • bootstrap-table的onClickRow事件(点击行改变行的背景颜色和其他属性)

    bootstrap-table的onClickRow事件(点击行改变行的背景颜色和其他属性)需求 在 bootstrap table 的表格中 点击某行改变该行的背景颜色和其他的属性 官方文档文档中分了 option 事件和 jQuery 事件 在这里我先用 option 事件完成需求 然后再用 jQuery 事件实现一次 之所以还要用 jQuery 事件实现一下是因为 jQuery 实现的过程有个注意点 在此记录一下 第一部分 option 事件 companyTable boo

    2026年3月26日
    2
  • C# WPF 基础教程「建议收藏」

    本课程是《C#WPF基础教程》,对应着教材的第1章到第17章。第1章  WPF概述      1.1  Windows图形演化      1.1.1  DirectX:新的图形引擎      1.1.2  硬件加速与WPF      1.2  WPF:高级API      1.2.1  Windows窗体将继续保留      1.2.2 

    2022年4月9日
    75
  • 模仿学习–技术综述[通俗易懂]

    模仿学习–技术综述[通俗易懂]概念:局限性:2.1数据的可获得性影子模式可以有效的解决数据的可获得性,但是其中的数据也包括了不值得提倡的司机行为;2.2模型的有效性端到端的特性:1)可解释性较差;可解释性上刚刚有所进展(可解释机器学习?-文档)2)难以在中间过程中,接收信息和指令;应用方式:1)基于规则的规划、控制模块,还是基础的功能实现方案;2)强化学习、模仿学习,作为规划、控制模块的备份方案,在极端场景下-connercase或规则无法覆盖的场景,能够有效的实现相应功能模块。论文及学习..

    2025年12月9日
    4
  • PostMan的安装和使用教程[通俗易懂]

    PostMan的安装和使用教程[通俗易懂]postman的下载官网:https://www.getpostman.com/downloads/创建账号或者用谷歌浏览器账号登录一个demo了解一下我做的是一个app,后台使用java做的,app通过ajax来请求后台,但是我不知道后台有没有请求成功!因此需要一个测试接口的东西测试我做的接口有没有问题我的app里面的ajax是这样写的api.aja…

    2026年1月17日
    6

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号