pandas fillna详解

pandas fillna详解pandas中补全nan具体的参数Series.fillna(self,value=None,method=None,axis=None,inplace=False,limit=None,downcast=None,**kwargs)[source]参数: value:scalar,dict,Series,orDataFrameValuetouset…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

pandas中补全nan


具体的参数
Series.fillna(self, value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)[source]


参数:	
value : scalar, dict, Series, or DataFrame
Value to use to fill holes (e.g. 0), alternately a dict/Series/DataFrame of values specifying which value to use for each index (for a Series) or column (for a DataFrame). Values not in the dict/Series/DataFrame will not be filled. This value cannot be a list.

其他的参数:

method : { 
   ‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}, default None
Method to use for filling holes in reindexed Series pad / ffill: propagate last valid observation forward to next valid backfill / bfill: use next valid observation to fill gap.

axis : { 
   0 or ‘index’}
Axis along which to fill missing values.

inplace : bool, default False
If True, fill in-place. Note: this will modify any other views on this object (e.g., a no-copy slice for a column in a DataFrame).

limit : int, default None
If method is specified, this is the maximum number of consecutive NaN values to forward/backward fill. In other words, if there is a gap with more than this number of consecutive NaNs, it will only be partially filled. If method is not specified, this is the maximum number of entries along the entire axis where NaNs will be filled. Must be greater than 0 if not None.

downcast : dict, default is None
A dict of item->dtype of what to downcast if possible, or the string ‘infer’ which will try to downcast to an appropriate equal type (e.g. float64 to int64 if possible).

Returns:	
Series
Object with missing values filled.

例子:

>>> df = pd.DataFrame([[np.nan, 2, np.nan, 0],
...                    [3, 4, np.nan, 1],
...                    [np.nan, np.nan, np.nan, 5],
...                    [np.nan, 3, np.nan, 4]],
...                   columns=list('ABCD'))
>>> df
     A    B   C  D
0  NaN  2.0 NaN  0
1  3.0  4.0 NaN  1
2  NaN  NaN NaN  5
3  NaN  3.0 NaN  4

补零

>>> df.fillna(0)
    A   B   C   D
0   0.0 2.0 0.0 0
1   3.0 4.0 0.0 1
2   0.0 0.0 0.0 5
3   0.0 3.0 0.0 4

向前补充,按列 ffill forward fill

>>> df.fillna(method='ffill')
    A   B   C   D
0   NaN 2.0 NaN 0
1   3.0 4.0 NaN 1
2   3.0 4.0 NaN 5
3   3.0 3.0 NaN 4

改变方向 axis = 1按行的方向

>>> df.fillna(method='ffill',axis=1)
 	A	B	C	D
0	NaN	2.0	2.0	0.0
1	3.0	4.0	4.0	1.0
2	NaN	NaN	NaN	5.0
3	NaN	3.0	3.0	4.0

按字典补充,列名:value

>>> values = { 
   'A': 0, 'B': 1, 'C': 2, 'D': 3}
>>> df.fillna(value=values)
    A   B   C   D
0   0.0 2.0 2.0 0
1   3.0 4.0 2.0 1
2   0.0 1.0 2.0 5
3   0.0 3.0 2.0 4

用limit限制补充的个数

>>> df.fillna(value=values, limit=1)
    A   B   C   D
0   0.0 2.0 2.0 0
1   3.0 4.0 NaN 1
2   NaN 1.0 NaN 5
3   NaN 3.0 NaN 4

实际中常用的按均值补充。

for column in list(df.columns[df.isnull().sum() > 0]):
    mean_val = df[column].mean()
    df[column].fillna(mean_val, inplace=True)

这是用来查看需要补充的列

list(df.columns[df.isnull().sum() > 0])
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/170010.html原文链接:https://javaforall.net

(0)
上一篇 2022年8月12日 上午10:00
下一篇 2022年8月12日 上午10:00


相关推荐

  • Ubuntu修改密码长度太短或太简单解决「建议收藏」

    Ubuntu修改密码长度太短或太简单解决「建议收藏」在安装Ubuntu的时候建立的帐户sai,想把密码改成两个字母aa,方便输入。运行终端sai@xmomx:~$passwdsai更改sai的密码。(当前)UNIX密码:xx输入新的UNIX密码:aa重新输入新的UNIX密码:aa必须选择更长的密码输入新的UNIX密码:1234567重新输入新的UNIX密码:1234567Bad:newpassword…

    2026年4月16日
    4
  • 蓝墨云班课php答案,蓝墨云班课试题库答案

    蓝墨云班课php答案,蓝墨云班课试题库答案蓝墨云班课试题库答案官网安卓版 是一款智能的定位在手机端的线上教学助手 App 是一款功能性非常强大的线上学习类的工具助手 能很好的方便教师进行备课 学生在完成学业后 在家中也能进行线上高效的学习 更能较为高效的进行对自己的线上课程进行管理 与老师机进行实时的互动 蓝墨云班课试题库答案特色 1 线上对综合相关的教育教学活动 能及时的进行管理学员信息 2 采用了全新的线上教学的新模式 将会使学员们进行

    2026年3月19日
    2
  • JavaScript作用域和作用域链详解

    JavaScript作用域和作用域链详解JavaScript 作用域链详解一 JavaScript 作用域 JavaScript 作用域是什么 作用域范围二 JavaScript 作用域链作用域与执行上下文总结一 JavaScript 作用域 JavaScript 作用域是什么 作用域是在运行时代码中的某些特定部分中变量 函数和对象的可访问性 换句话说 作用域决定了代码区块中变量和其他资源的可见性 作用域范围块语句 大括号 中间的语句 如 if 和 switch 条件语句或 for 和 while 循环语句 不像函数 它们不会创建一个新的作用域

    2026年3月26日
    2
  • VScode下MarkDown【自动生成目录】 和 【画流程图】(最全教程)

    VScode下MarkDown【自动生成目录】 和 【画流程图】(最全教程)关于插件 MarkdownPrev MPE 的使用技巧目录 关于插件 MarkdownPrev MPE 的使用技巧 0 Preview 预览 1 关于 TOC2 绘制流程图 2 0 简介 2 1flow2 2mermaid2 2 0 配置绘图主题颜色 2 2 1Flowchart 流程图 2 2 2Seque

    2026年3月18日
    2
  • certutil 导入 CA 证书

    certutil 导入 CA 证书

    2022年3月1日
    78
  • 数据库设计工具—–PD

    数据库设计工具—–PD数据库设计工具—–PDPowerDesign是一款功能强大的建模软件,提供强大的元数据管理功能,可以帮助用户构建关键信息的全方位视图,创建多种类型的模型,包括数据模型,物理模型,面向对象模型等等。同时继承了数据管理、BL、数据集成和数据整合多种功能。这是一款收费软件安装完成后,就来介绍一下基本使用。注意:这是一款功能非常非常非常强大的软件,我们只是介绍一下一小部分我们数据库用到的功能。进入软件后界面如下:我们点击file->然后创建一个model(模型)。然后创建一个物理

    2022年7月11日
    31

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号