python 处理数据归一化

全栈程序员-站长 • 2022年6月23日下午2:16 • 未分类 • 阅读 33

python 处理数据归一化数据规范化为了消除指标之间的量纲和取值范围差异的影响，需要进行标准化（归一化）处理，将数据按照比例进行缩放，使之落入一个特定的区域，便于进行综合分析。数据规范化方法主要有：-最小-最大规范化-零-均值规范化数据示例代码实现#-*-coding:utf-8-*-#数据规范化importpandasaspdimportnumpyasnpdat…

大家好，又见面了，我是你们的朋友全栈君。

数据规范化
为了消除指标之间的量纲和取值范围差异的影响，需要进行标准化（归一化）处理，将数据按照比例进行缩放，使之落入一个特定的区域，便于进行综合分析。

数据规范化方法主要有： 
- 最小-最大规范化 
- 零-均值规范化

数据示例


代码实现
#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np

datafile = '../data/normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据

(data - data.min())/(data.max() - data.min()) #最小-最大规范化
(data - data.mean())/data.std() #零-均值规范化

从命令行可以看到下面的输出：

>>> (data-data.min())/(data.max()-data.min(
          0         1         2         3
0  0.074380  0.937291  0.923520  1.000000
1  0.619835  0.000000  0.000000  0.850941
2  0.214876  0.119565  0.813322  0.000000
3  0.000000  1.000000  1.000000  0.563676
4  1.000000  0.942308  0.996711  0.804149
5  0.264463  0.838629  0.814967  0.909310
6  0.636364  0.846990  0.786184  0.929571

>>> (data-data.mean())/data.std()
          0         1         2         3
0 -0.905383  0.635863  0.464531  0.798149
1  0.604678 -1.587675 -2.193167  0.369390
2 -0.516428 -1.304030  0.147406 -2.078279
3 -1.111301  0.784628  0.684625 -0.456906
4  1.657146  0.647765  0.675159  0.234796
5 -0.379150  0.401807  0.152139  0.537286
6  0.650438  0.421642  0.069308  0.595564

转载链接: https://blog.csdn.net/sinat_25873421/article/details/80753121

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/152331.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

算法模型定义介绍

上一篇 2022年6月23日下午2:16

RPN网络理解[通俗易懂]

下一篇 2022年6月23日下午2:16

samba 域认证配置

samba 域认证配置

全栈程序员-站长
2021年8月30日
55
openclaw

Mac mini 变身 AI 运维中枢：OpenClaw Mac mini本地化部署

Mac mini 变身 AI 运维中枢：OpenClaw Mac mini本地化部署

Ai探索者
2026年3月13日
2
linux 如何查看mysql版本,Linux系统下查看mysql版本的四种方法

linux 如何查看mysql版本,Linux系统下查看mysql版本的四种方法1：在终端下：mysql-V。以下是代码片段：复制代码代码如下:[shengting@login~]$mysql-VmysqlVer14.7Distrib4.1.10a,forredhat-linux-gnu(i686)2：在mysql中：mysql>status;以下是代码片段：复制代码代码如下:mysql>status;————–m…

全栈程序员-站长
2025年5月31日
2
全连接层通俗讲解

全连接层通俗讲解概念什么是全连接层 fullyconnect FC 全连接层 fullyconnect FC 在整个卷积神经网络中起到分类器的作用如果说卷积层池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话全连接层则起到将学到的分布式特征表示映射到样本标记空间的作用在实际使用中全连接层可由卷积操作实现对前层是全连接的全连接层可以转化为卷

全栈程序员-站长
2026年3月17日
1
python repl_Python自学第二天 REPL+基础语法

python repl_Python自学第二天 REPL+基础语法一什么是 REPL 其实 REPL 就是一种概念让我们来看一个简单的例子 image png 当我们 win R 进入 dos 环境后输入 python 光标会进入等待输入状态即光标不停闪动且前方出现 gt gt gt 这种过程就是 REPL 比如我们输入 1 1 image png 输入 1 1 后会读取你输入的值即为 Read 读取后执行即为 Evaluate 输出结果即为 Prin

全栈程序员-站长
2026年1月15日
3
MYSQL中TINYINT的取值范围

原文地址：https://blog.csdn.net/lysygyy/article/details/5983433在MySQL的数据类型中，Tinyint的取值范围是：带符号的范围是-128到127。无符号的范围是0到255（见官方《MySQL5.1参考手册》http://dev.mysql.com/doc/refman/5.1/zh/column-types.html#numeri…

全栈程序员-站长
2022年4月5日
52

发表回复

关注全栈程序员社区公众号