pandas中使用fillna函数填充NaN值「建议收藏」

pandas中使用fillna函数填充NaN值「建议收藏」1.参数解析1.1inplace参数取值:True、FalseTrue:直接修改原对象False:创建一个副本,修改副本,原对象不变(缺省默认)1.2method参数取值:{‘pad’,‘ffill’,‘backfill’,‘bfill’,None},defaultNonepad/ffill:用前一个非缺失值去填充该缺失值backfill/bfill:用下一个非缺失值填充该缺失值None:指定一个值去替换缺失值(缺省默认这种方式)1.3limit参数:限制

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

1. 参数解析

1.1 inplace参数

取值:True、False

True:直接修改原对象

False:创建一个副本,修改副本,原对象不变(缺省默认)

1.2 method参数

取值 : {‘pad’, ‘ffill’,‘backfill’, ‘bfill’, None}, default None

pad/ffill:用前一个非缺失值去填充该缺失值

backfill/bfill:用下一个非缺失值填充该缺失值

None:指定一个值去替换缺失值(缺省默认这种方式)

1.3 limit参数:

限制填充个数

1.4 axis参数

修改填充方向

补充

isnull 和 notnull 函数用于判断是否有缺失值数据
isnull:缺失值为True,非缺失值为False
notnull:缺失值为False,非缺失值为True

2. 代码实例

#导包
import pandas as pd
import numpy as np
from numpy import nan as NaN
df1=pd.DataFrame([[1,2,3],[NaN,NaN,2],[NaN,NaN,NaN],[8,8,NaN]])
df1

代码结果:

     0    1    2
0  1.0  2.0  3.0
1  NaN  NaN  2.0
2  NaN  NaN  NaN
3  8.0  8.0  NaN

2.1 常数填充

2.1.1 用常数填充

#1.用常数填充
print (df1.fillna(100))
print ("-----------------------")
print (df1)

运行结果:

       0      1      2
0    1.0    2.0    3.0
1  100.0  100.0    2.0
2  100.0  100.0  100.0
3    8.0    8.0  100.0
-----------------------
     0    1    2
0  1.0  2.0  3.0
1  NaN  NaN  2.0
2  NaN  NaN  NaN
3  8.0  8.0  NaN

2.1.2 用字典填充

第key列的NaN用key对应的value值填充

df1.fillna({ 
   0:10,1:20,2:30})

运行结果:

      0     1     2
0   1.0   2.0   3.0
1  10.0  20.0   2.0
2  10.0  20.0  30.0
3   8.0   8.0  30.0

2.2 使用inplace参数

print (df1.fillna(0,inplace=True))
print ("-------------------------")
print (df1)

运行结果:

在这里插入代码片

2.3 使用method参数

1.method = 'ffill'/'pad':用前一个非缺失值去填充该缺失值

df2 = pd.DataFrame(np.random.randint(0,10,(5,5)))
df2.iloc[1:4,3] = None
df2.iloc[2:4,4] = None
print(df2)
print ("-------------------------")
print(df2.fillna(method='ffill'))

运行结果:

   0  1  2    3    4
0  8  4  4  5.0  6.0
1  5  2  8  NaN  7.0
2  6  3  1  NaN  NaN
3  5  4  9  NaN  NaN
4  6  5  4  6.0  9.0
-------------------------
   0  1  2    3    4
0  8  4  4  5.0  6.0
1  5  2  8  5.0  7.0
2  6  3  1  5.0  7.0
3  5  4  9  5.0  7.0
4  6  5  4  6.0  9.0

2.method = ‘bflii’/‘backfill’:用下一个非缺失值填充该缺失值

df2 = pd.DataFrame(np.random.randint(0,10,(5,5)))
df2.iloc[1:4,3] = None
df2.iloc[2:4,4] = None
print(df2)
print ("-------------------------")
print(df2.fillna(method='bfill'))

运行结果:

   0  1  2    3    4
0  1  0  4  1.0  3.0
1  4  6  4  NaN  2.0
2  4  9  2  NaN  NaN
3  9  7  3  NaN  NaN
4  6  1  3  5.0  5.0
-------------------------
   0  1  2    3    4
0  1  0  4  1.0  3.0
1  4  6  4  5.0  2.0
2  4  9  2  5.0  5.0
3  9  7  3  5.0  5.0
4  6  1  3  5.0  5.0

2.4 使用limit参数

用下一个非缺失值填充该缺失值且每列只填充2个

df2 = pd.DataFrame(np.random.randint(0,10,(5,5)))
df2.iloc[1:4,3] = None
df2.iloc[2:4,4] = None
print(df2)
print ("-------------------------")
print(df2.fillna(method='bfill', limit=2))

运行结果:

   0  1  2    3    4
0  2  0  4  4.0  0.0
1  7  9  9  NaN  1.0
2  1  7  3  NaN  NaN
3  8  5  8  NaN  NaN
4  8  6  2  4.0  4.0
-------------------------
   0  1  2    3    4
0  2  0  4  4.0  0.0
1  7  9  9  NaN  1.0
2  1  7  3  4.0  4.0
3  8  5  8  4.0  4.0
4  8  6  2  4.0  4.0

2.5 使用axis参数

axis=0 对每列数据进行操作
axis=1 对每行数据进行操作

df2 = pd.DataFrame(np.random.randint(0,10,(5,5)))
df2.iloc[1:4,3] = None
df2.iloc[2:4,4] = None
print(df2.fillna(method="ffill", limit=1, axis=1))

运行结果:

    0    1    2    3    4
0  0.0  4.0  9.0  7.0  2.0
1  6.0  5.0  0.0  0.0  3.0
2  8.0  8.0  8.0  8.0  NaN
3  5.0  5.0  6.0  6.0  NaN
4  7.0  5.0  7.0  4.0  1.0

还有一些pandas的基础运算请参考这篇文章->pandas | DataFrame基础运算以及空值填充

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/170012.html原文链接:https://javaforall.net

(0)
上一篇 2022年8月12日 上午10:00
下一篇 2022年8月12日 上午10:16


相关推荐

  • Java常用设计模式

    Java常用设计模式一、设计模式概念1、定义​Java包含23种设计模式,是一套对代码设计经验的总结,被人们反复利用,多人熟知的代码设计方式。2、目的​为了提高代码的可读性,可扩展性以及代码的复用性,为了解决在写代码过程中遇到的代码设计问题。3、设计模式的六大原则​3.1开闭原则​对扩展开放,对修改关闭(尽可能对代码少修改)​3.2里氏替换原则​它是面向对象基本原则之一,任何父类(基类)出现的地方,子类都可以出现,也就是子类可以替换父类的任何功能(体现了父类的可扩展性)3.3依赖

    2022年7月8日
    25
  • centos7安装python3.6_centos7一键安装python3

    centos7安装python3.6_centos7一键安装python3centos7安装Python3安装Python3安装Python31.安装wget(如已经存在,忽略此步)yum-yinstallwget2.下载python3源码包wgethttps://www.python.org/ftp/python/3.6.6/Python-3.6.6.tgz3.下载python3编译的依赖包yuminstall-ygccpatchlibffi-develpython-develzlib-develbzip2-develope

    2026年3月8日
    5
  • ArrayList中的toArray[通俗易懂]

    ArrayList中的toArray[通俗易懂]ArrayList提供了一个将List转为数组的一个非常方便的方法toArray。toArray有两个重载的方法:1.list.toArray();2.list.toArray(T[] a);对于第一个重载方法,是将list直接转为Object[]数组;第二种方法是将list转化为你所需要类型的数组,当然我们用的时候会转化为与list内容相同的类型。 

    2022年5月15日
    42
  • Android SDK下载太慢

    Android SDK下载太慢AndroidSDK下载太慢,可以通过设置合适的代理服务器来解决。

    2022年7月19日
    19
  • 吉利GKUI车机任意安装第三方APP软件教程,DNS劫持应用商店安装软件

    吉利GKUI车机任意安装第三方APP软件教程,DNS劫持应用商店安装软件任意安装你想要的 APP 文中使用的方法为 DNS 劫持车机应用商店 需要你具备一定的操作能力 否则将无法达到最终目的 阅读本文 视为你有一定电脑基础 请不要重复询问无关痛痒的问题 百度就是最好的老师 支持车型 博瑞 GE 全系列 18 款 20 款博越 星越全系列 缤越全系列 缤瑞全系列 嘉际全系列等车型文中使用的 dns 地址为 47 95 115 6 教程所需物料 根据教程来操作 只

    2026年3月20日
    2
  • 医学图像处理最全综述「建议收藏」

    目录0、引言1、病变检测2、图像分割基于深度学习的医学图像分割与检测3、图像配准图像配准的定义4、图像融合5、预测与挑战6、结论参考文献0、引言医学图像处理的对象是各种不同成像机理的医学影像,临床广泛使用的医学成像种类主要有X-射线成像(X-CT)、核磁共振成像(MRI)、核医学成像(NMI)、超声波成像(UI)四类。在目前的影像医疗诊断中,主要是通过观察一组二维切片图象去发现病变体,这往往需要借助医生的经验来判定。利用计算机图像处理技术对二维切片图象进行.

    2022年4月7日
    202

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号