数据预处理无量纲化处理_统计数据的预处理

数据预处理无量纲化处理_统计数据的预处理1.无量纲化定义无量纲化,也称为数据的规范化,是指不同指标之间由于存在量纲不同致其不具可比性,故首先需将指标进行无量纲化,消除量纲影响后再进行接下来的分析。2.无量纲化方法无量纲化方法有很多,但

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

1.无量纲化定义

无量纲化,也称为数据的规范化,是指不同指标之间由于存在量纲不同致其不具可比性,故首先需将指标进行无量纲化,消除量纲影响后再进行接下来的分析。

2.无量纲化方法

无量纲化方法有很多,但是从几何角度来说可以分为:直线型、折线型、曲线形无量纲化方法。

(1)直线型无量纲化方法

直线型无量纲化方法是指指标原始值与无量纲化后的指标值之间呈现线性关系,常用的线性量化方法有阈值法、标准化法与比重法。

①阈值法是我们最熟悉也最常用的一种无量纲化方法,阈值也称临界值,是指衡量事物发展变化的一些特殊指标值,如极大值、极小值等,而阈值法就是通过实际值与阈值对比得到无量纲化指标值的方法。主要公式以及特点如下图中所示。

数据预处理无量纲化处理_统计数据的预处理

 

值得注意的一点,阈值参数的选取确定却会直接影响分析的结果,这里需考虑实际情况加上已有经验进行探索,逐步优化,直到寻找最合适的阈值(最合适就是结果可以达到让自己满意的程度)。

②标准化方法就是指标原始值减去该指标的均值然后比上其标准差。

无论指标实际值是多少,最终将分布在零的两侧,与阈值法相比,标准化方法利用样本更多的信息,且标准化后的数据取值范围将不在[0,1]之间。

③比重法是将指标实际值转化为他在指标值总和中所占的比重。

(2)折线型无量纲化方法

折线型无量纲化适用于被评价事物呈现阶段性变化,即指标值在不同阶段变化对事物总体水平影响是不一样的。

虽然折线型无量纲化方法比直线型无量纲化方法更符合实际情况,但是要想确定指标值的转折点不是一件容易的事情,需要对数据有足够的了解和掌握。

(3)曲线形无量纲化方法

 有些事物发展的阶段性变化并不是很明显,而前、中、后期的发展情况又各不相同,就是说指标值的变化是循序渐进的,并不是突变的,在这种情况下,曲线形无量纲化方法也更为合适,常用的曲线形无量纲化方法如下图所示:

数据预处理无量纲化处理_统计数据的预处理

(4)模糊无量纲化方法

综合评价中的评价指标可以分为正向指标(即指标值越大越好)、逆指标(即指标值越小越好)和适度指标(即指标值落在某个区间最好,大了、小了都不好),指标彼此之间“好”与“坏”并没有一个标准,在很大程度上具有一定的模糊性,这时候可以选择此方法对指标进行无量纲化处理,有兴趣自行搜索学习。

 

本文参考: https://wenku.baidu.com/view/34187066f01dc281e53af0fc.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/167172.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • FCoin“出事”后,团队关键人物回复了![通俗易懂]

    记者:李小平2月12日晚,FCoin交易所的一则“关于系统维护最新进度及开放提现申请”公告在社区引发巨大争议。公告称:一、经核查,系统未曾遭受过外部黑客入侵。二、由于团队关键人员失联,以…

    2022年4月6日
    68
  • dll文件注册器_VS语言

    dll文件注册器_VS语言点击  开始\所有程序\MicrosoftVisualStudio2008\VisualStudioTools 以管理员身份运行VisualStudio2008CommandPrompt。//注册Dll在VisualStudio2008CommandPrompt键入E:\>regasmmydll.dll.eg:E:\>regasmE:\Assig

    2022年10月11日
    2
  • Zabbix常用监控项整理

    Zabbix常用监控项整理https://blog.51cto.com/ttxsgoto/1771752最近整理了一份常用Zabbix监控项说明,主要包括常见Windows&Linux监控,如下:Windons系统:项目 items items说明内存 vm.memory.size[free] 系统可用内存量vm.memory.size[total] 系统总共内存量swap空间 system.swa…

    2022年6月12日
    51
  • 广东移动DNS收集[通俗易懂]

    广东移动DNS收集[通俗易懂]有些网站的CDN有问题,使用第三方DNS会有访问不了的情况。多数是因为CDN通过DNS请求来源解析出对应线路的服务器IP,但使用第三方DNS时会出现把移动来源解析为电信来源,而服务器电信线路IP又拒绝非电信来源IP访问时,就会出现无法访问网站的情况。所以,使用移动网络的时候,还是尽量使用移动自己的DNS吧!这里收集了一下广东移动的DNS,非移动用户估计用不了。ns3.gd.

    2022年7月11日
    74
  • 如何在 Python 中使用断点调试

    如何在 Python 中使用断点调试实际上没人能一次就写出完美的代码,除了我。但是世界上只有一个我。–林纳斯·托瓦兹(Linux之父) 既然不是神,写代码自然免不了要修改。修改代码的过程被称作调试,又叫 debug。 刚接触编程的人,往往对调试代码没有很深的认识,觉得把功能做出来就完事了。一旦程序运行出现问题,便无从下手。而实际开发中,调试代码通常要花费比新编写代码更多的时间。所谓“行百里者半于九十”,这句…

    2022年5月21日
    45
  • 微服务架构-实现技术之具体实现工具与框架8:Spring Cloud Config原理与注意事项

    目录注:主要只做理论性的总结与分析,相关实战代码会在后面的博客中和github中逐步增加。一、配置中心的由来及选择(一)配置中心由来(二)配置中心要求具备的功能(三)配置中心基本流转图和支撑体系分析​(四)多种配置中心的选择与对比方案二、SpringCloudConfig概述及基本实现方法介绍三、SpringClo…

    2022年4月6日
    50

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号