预测算法简介

预测算法简介原文 0Afewmorecon 1 什么是 bagging 和 boosting linkbagging Bagging 是 BootstrapAgg 的英文缩写 是指一种有放回采样 boosting 提升方法 Boosting 是一种可以用来减小监督式学习中偏差的机器学习算法 面对的问题是迈可 肯斯 MichaelKearn 提出的 一组 弱学习者 的集合能否生成一个 强学习者 弱学习者一般是指一个分类器 它的结果只比随机分类好一点点

原文

0 A few more concept you need to know

0.1 什么是bagging和boosting|link

bagging:Bagging是Bootstrap Aggregating的英文缩写,是指一种有放回采样
boosting:提升方法(Boosting),是一种可以用来减小监督式学习中偏差的机器学习算法。面对的问题是迈可·肯斯(Michael Kearns)提出的:一组“弱学习者”的集合能否生成一个“强学习者”?弱学习者一般是指一个分类器,它的结果只比随机分类好一点点;强学习者指分类器的结果非常接近真值。

0.2 预测和拟合的区别?

预测:灰色预测的通用性比较强一些,一般场合都可以用,尤其适合那些规律性差且不清楚数据产生机理的情况。

拟合:拟合比较适合于那些清楚数据产生机理,有比较规则的变化趋势的场景,比如已经知道这些数据符合一定的动力学变化规律,这时用指数拟合就比较合适。

在数学建模中,能用拟合的地方尽量用拟合,这样会有具体的函数表达式,更有利于进一步的建模。当然有些问题就是数据的预测,这种情况哪种精度高就用哪种了(建议都用,便于比较),上面所说的最适合的问题,也主要是基于精度考虑的。

0.3 预测和推荐的区别?

0.4 时间序列预测法|link

时间序列预测法其实是一种回归预测方法,属于定量预测,其基本原理是:一方面承认事物发展的延续性,运用过去的时间序列数据进行统计分析,推测出事物的发展趋势;另一方面充分考虑到由于偶然因素影响而产生的随机性,为了消除随机波动产生的影响,利用历史数据进行统计分析,并对数据进行适当处理,进行趋势预测。

0.5 什么有量纲和什么是无量纲?

1 线性回归|link

定义:确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法

2 逻辑回归|link

概念:线性回归可以拟合X与Y之间的关系,但回归模型中Y值是连续的,如果换成一个二分类标签,Y只能取两个值0、1,这时候就不能用线性回归了,这样就有了逻辑回归。

3 支持向量机|link

image

4 随机森林算法|link

所以随机森林算法的随机性主要体现在以下两个方面:

  • 子模型的训练样本是随机抽取的
  • 子模型的特征变量也是随机抽取的

掌握随机森林之前,你学要具备如下知识:

  • 集成学习
  • 决策树
  • 信息熵| more concept

随机森林的优缺点:| learn more

  • (1)速度快: 计算量相对较小, 且容易转化成分类规则. 只要沿着树根向下一直走到叶, 沿途的分裂条件就能够唯一确定一条分类的谓词.
  • (2)准确性高: 挖掘出来的分类规则准确性高, 便于理解, 决策树可以清晰的显示哪些字段比较重要, 即可以生成可以理解的规则.
  • (3)可以处理连续和种类字段
  • (4)不需要任何领域知识和参数假设
  • (5)适合高维数据

缺点:

  • (1)对于各类别样本数量不一致的数据, 信息增益偏向于那些更多数值的特征
  • (2)容易过拟合
  • (3)忽略属性之间的相关性

5 AdaBoost|link

6 贝叶斯网络|link

7 自编码网络|link

7.1 什么是自编码器?

x’ = g(y) = g(f(x))

自编码器的目的是,让输出x’尽可能复现输入x。

如果f和g都是恒等映射,那不就恒有x’=x?不错,但是这样的变换没啥作用。因此,我们对中间信号y做一定的约束,这样,系统往往能学出很有趣的编码变换f和编码y。

对于自编码器,我们需要强调一点是,我们往往并不关心输出是啥(反正只是复现输入),我们关心的是中间层的编码,或者说是从输入到编码的映射。

可以这么理解,我们在强迫编码y和输入x不同的情况下,系统还能复原原始信号x,那么说明编码y已经承载了原始数据的所有信息,但以另一种形式表现。这就是特征提取,而且是主动学出来的。实际上,自动学习原始数据的特征表达也是神经网络和深度学习的核心目的之一。

7.2 什么自编码网络?

自编码网络是非监督学习领域的一种,可以自动从无标注的数据中学习特征,是一种以重构输入信息为目标的神经网络,它可以给出比原始数据更好的特征描述,具有较强的特征学习能力,在深度学习中常用自编码网络生成的特征来取代原始数据,已取得更好效果。

image
自编码器通过隐藏层对输入进行压缩,并在输出层中解压缩,整个过程肯定会丢失信息,但是通过训练我们能够使丢失的信息尽量减少,最大化的保留其主要特征。

其中L表示损失函数,结合数据的不同形式,可以是二次误差(squared error loss)或交叉熵误差(cross entropy loss)。

写在最后

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/216799.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月18日 上午11:02
下一篇 2026年3月18日 上午11:02


相关推荐

  • latex调整itemize的间距大小

    latex调整itemize的间距大小参考 Latex 调整 item 间距问题 默认情况下 itemize 的各项间的间距较大 占用文章空间较多 那么如何调整呢 方法 1 单独设置每个 itemize 的间距 begin itemize setlength itemsep 0pt setlength parsep 0pt setlength parskip 0pt item item en

    2026年3月18日
    2
  • 什么是IDOR(不安全的直接对象引用)

    什么是IDOR(不安全的直接对象引用)自从2010年开始,不安全的直接对象引用(IDOR)就已经成为了OWASPTop10Web应用安全风险中影响程度排名第四的安全漏洞了。IDOR将允许一名授权用户获取其他用户的信息,意指一个已经授权的用户通过更改访问时的一个参数,从而访问到了原本其并没有得到授权的对象。Web应用往往在生成Web页面或服务时会用它的真实名字,且并不会对所有目标对象的请求访问进行用户权限检测,所以这就造成了不安…

    2022年6月12日
    62
  • navicat 在线激活码(注册激活)

    (navicat 在线激活码)最近有小伙伴私信我,问我这边有没有免费的intellijIdea的激活码,然后我将全栈君台教程分享给他了。激活成功之后他一直表示感谢,哈哈~IntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,下面是详细链接哦~https://javaforall.net/100143.html…

    2022年3月26日
    148
  • 谈谈CListCtrl 扩展风格设置方法-SetExtendedStyle和ModifyStyleEx 比較

    谈谈CListCtrl 扩展风格设置方法-SetExtendedStyle和ModifyStyleEx 比較谈谈CListCtrl扩展风格设置方法————————————–SetExtendedStyle和ModifyStyleEx比較对于刚開始学习的人来说,当他须要设定listctrl的扩展风格时,经常想到用ModifyStyleEx来设定,代码例如以下:ModifyStyleEx(0,LVS_EX_GRIDLINES)…

    2022年7月19日
    18
  • 类似于吾爱激活成功教程的免费论坛_哔哩哔哩吾爱激活成功教程

    类似于吾爱激活成功教程的免费论坛_哔哩哔哩吾爱激活成功教程吾爱激活成功教程吧http://www.52pjb.net/网站收集了众多软件,类似于软件博客这种,同行业的还有胡萝卜周、易激活成功教程、心海这类的,如果你喜欢这种风格的软件下载博客,那么它绝对是首选,当然也是不要钱的,也没有什么赞助收费这类的盈利,站长完全是用爱发电!不过缺点是有些资源需要用网盘下载,毕竟是激活成功教程软件,也是可以理解的!吾爱激活成功教程论坛他也是目前国内最大的软件激活成功教程论坛,而且网友都很热心,也是国内下载氛围最好的软件下载网站论坛,也还不错。正版中国是一个分享正版软件限时免费..

    2022年10月13日
    5
  • Claude Code 常见问题(FAQ):模型与计费

    Claude Code 常见问题(FAQ):模型与计费

    2026年3月15日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号