pandas用平均值填充缺失值_pandas筛选列不为空值

pandas用平均值填充缺失值_pandas筛选列不为空值官方fillna方法文档pandas中fillna()方法,能够使用指定的方法填充NA/NaN值。1.函数详解函数形式:fillna(value=None,method=None,axis=None,inplace=False,limit=None,downcast=None,**kwargs)参数:value:用于填充的空值的值。method:{‘backfill…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

  • ? 版权: 本文由【墨理学AI】原创、在CSDN首发、各位大佬、感谢查阅、感谢三连、感谢关注

基础参考资料


1


pandasfillna()方法,能够使用指定的方法填充NA/NaN值。

函数详解

函数形式:fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)

参数:

value:用于填充的空值的值。

method: {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}, default None。定义了填充空值的方法, pad / ffill表示用前面行/列的值,填充当前行/列的空值, backfill / bfill表示用后面行/列的值,填充当前行/列的空值。

axis:轴。0或’index’,表示按行删除;1或’columns’,表示按列删除。

inplace:是否原地替换。布尔值,默认为False。如果为True,则在原DataFrame上进行操作,返回值为None。

limit:int, default None。如果method被指定,对于连续的空值,这段连续区域,最多填充前 limit 个空值(如果存在多段连续区域,每段最多填充前 limit 个空值)。如果method未被指定, 在该axis下,最多填充前 limit 个空值(不论空值连续区间是否间断)

downcast:dict, default is None,字典中的项为,为类型向下转换规则。或者为字符串“infer”,此时会在合适的等价类型之间进行向下转换,比如float64 to int64 if possible。

返回值:
DataFrame or None
Object with missing values filled or None if inplace=True.


  • 用均值进行填充:
for column in list(df.columns[df.isnull().sum() > 0]):
    mean_val = df[column].mean()
    df[column].fillna(mean_val, inplace=True)

  • 用后一行的值进行填充NaN
print(df.fillna(method='backfill', axis=0, inplace=False))
  • 我的测试代码如下:
import numpy as np
import pandas as pd

a = np.arange(100, dtype=float).reshape((10, 10))

a[0, 1] = np.nan
a[0, 3] = np.nan
a[0, 4] = np.nan
a[0, 6] = np.nan

a[3, 1] = np.nan
a[3, 3] = np.nan
a[3, 4] = np.nan
a[3, 6] = np.nan

df = pd.DataFrame(data=a)
# 重命名列名
df.columns = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']

print(df)
# 筛选需要填充的列
print(df.columns[df.isnull().sum() > 0])

# 用列均值进行填充NaN
for column in list(df.columns[df.isnull().sum() > 0]):
    mean_val = df[column].mean()
    df[column].fillna(mean_val, inplace=True)

# 用后一行的值进行填充NaN
# print(df.fillna(method='backfill', axis=0, inplace=True))


# 筛选需要填充的列 发现没有这样的列了
print(df.columns[df.isnull().sum() > 0])

print(df)



9-8

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/169999.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 详解CALayer的anchorPoint和position[通俗易懂]

    详解CALayer的anchorPoint和position[通俗易懂]CALayerCALayer属于QuartzCore框架,用于在iOS和MacOS系统上可见元素的绘制,和属于UIKit框架的UIView的关系是,UIView默认会创建一个CALayer属性,用于图象的绘制和显示.当然,CALayer也可以单独创建.区别UIView可以处理用户交互事件,而CALayer不行.CALayer具备以下UIView没有的功能:阴影,圆角,边框 …

    2022年10月8日
    5
  • VHDL与Verilog HDL的运算符区别[通俗易懂]

    VHDL与Verilog HDL的运算符区别[通俗易懂]不断完善。1、VHDL是没有&&、||、!这几个逻辑运算符,而VerilogHDL是有的。2、VHDL是采用and、or、not、nor、xor进行位运算的,而VerilogHDL则是与C/C++相同采用:&、|、~、^、^~。3、VHDL的关系运算中等于和不等于分别是:=,/=,而Verilog中是==,!=。4、VHDL的连接运算符是&,用来连接不同的位/矢量,

    2022年9月21日
    2
  • IM在线聊天-微聊即时通讯完整源码「建议收藏」

    IM在线聊天-微聊即时通讯完整源码「建议收藏」简介:好友分享的,社区发布过很多版即时通讯了,零零碎碎几十套了,这个看了下和之前的有点小区别,同样是可以后台直接挂地址,方便内嵌一些cp啊,单啊之类的程序在里面,带一个简易的搭建说明,linux下运行的。网盘下载地址:http://kekewl.org/6zo4TAmfVRe0图片:…

    2022年5月15日
    36
  • Windows 10 下,强制关闭端口

    Windows 10 下,强制关闭端口Windows10下,端口被占用或程序已关闭端口没有正常关闭时,强制关闭端口这种方法的前提是知道被占用的端口号这是我用的一种方法1、打开命令窗口,根据端口号查询这个端口号的PID,以端口号9001为例进入命令窗口执行命令netstat-ano|findstr”9001″如下图查询到端口9001对应的pid为566322、根据查出来的pid强制关闭这个端口号命令…

    2022年7月20日
    51
  • strstr函数的详细讲解

    strstr函数的详细讲解定义:strstr(str1,str2)函数用于判断字符串str2是否是str1的子串。如果是,则该函数返回str2在str1中首次出现的地址;否则,返回NULL。比如:charstr2=“cdef”;charstr1=“abcdefgh”;则通过函数,将返回strstr(str1,str2)=cdefgh;如果str1不包含有str2。charstr…

    2022年6月25日
    31
  • docker镜像和docker容器的关系_docker基础镜像和项目镜像

    docker镜像和docker容器的关系_docker基础镜像和项目镜像一、docker常用命令#镜像名版本标签镜像id创建时间镜像大小REPOSITORYTAGIMAGEIDCREATEDSIZEhello-worldlatestfce289

    2022年8月16日
    8

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号