pandas fillna详解

pandas fillna详解pandas中补全nan具体的参数Series.fillna(self,value=None,method=None,axis=None,inplace=False,limit=None,downcast=None,**kwargs)[source]参数: value:scalar,dict,Series,orDataFrameValuetouset…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

pandas中补全nan


具体的参数
Series.fillna(self, value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)[source]


参数:	
value : scalar, dict, Series, or DataFrame
Value to use to fill holes (e.g. 0), alternately a dict/Series/DataFrame of values specifying which value to use for each index (for a Series) or column (for a DataFrame). Values not in the dict/Series/DataFrame will not be filled. This value cannot be a list.

其他的参数:

method : { 
   ‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}, default None
Method to use for filling holes in reindexed Series pad / ffill: propagate last valid observation forward to next valid backfill / bfill: use next valid observation to fill gap.

axis : { 
   0 or ‘index’}
Axis along which to fill missing values.

inplace : bool, default False
If True, fill in-place. Note: this will modify any other views on this object (e.g., a no-copy slice for a column in a DataFrame).

limit : int, default None
If method is specified, this is the maximum number of consecutive NaN values to forward/backward fill. In other words, if there is a gap with more than this number of consecutive NaNs, it will only be partially filled. If method is not specified, this is the maximum number of entries along the entire axis where NaNs will be filled. Must be greater than 0 if not None.

downcast : dict, default is None
A dict of item->dtype of what to downcast if possible, or the string ‘infer’ which will try to downcast to an appropriate equal type (e.g. float64 to int64 if possible).

Returns:	
Series
Object with missing values filled.

例子:

>>> df = pd.DataFrame([[np.nan, 2, np.nan, 0],
...                    [3, 4, np.nan, 1],
...                    [np.nan, np.nan, np.nan, 5],
...                    [np.nan, 3, np.nan, 4]],
...                   columns=list('ABCD'))
>>> df
     A    B   C  D
0  NaN  2.0 NaN  0
1  3.0  4.0 NaN  1
2  NaN  NaN NaN  5
3  NaN  3.0 NaN  4

补零

>>> df.fillna(0)
    A   B   C   D
0   0.0 2.0 0.0 0
1   3.0 4.0 0.0 1
2   0.0 0.0 0.0 5
3   0.0 3.0 0.0 4

向前补充,按列 ffill forward fill

>>> df.fillna(method='ffill')
    A   B   C   D
0   NaN 2.0 NaN 0
1   3.0 4.0 NaN 1
2   3.0 4.0 NaN 5
3   3.0 3.0 NaN 4

改变方向 axis = 1按行的方向

>>> df.fillna(method='ffill',axis=1)
 	A	B	C	D
0	NaN	2.0	2.0	0.0
1	3.0	4.0	4.0	1.0
2	NaN	NaN	NaN	5.0
3	NaN	3.0	3.0	4.0

按字典补充,列名:value

>>> values = { 
   'A': 0, 'B': 1, 'C': 2, 'D': 3}
>>> df.fillna(value=values)
    A   B   C   D
0   0.0 2.0 2.0 0
1   3.0 4.0 2.0 1
2   0.0 1.0 2.0 5
3   0.0 3.0 2.0 4

用limit限制补充的个数

>>> df.fillna(value=values, limit=1)
    A   B   C   D
0   0.0 2.0 2.0 0
1   3.0 4.0 NaN 1
2   NaN 1.0 NaN 5
3   NaN 3.0 NaN 4

实际中常用的按均值补充。

for column in list(df.columns[df.isnull().sum() > 0]):
    mean_val = df[column].mean()
    df[column].fillna(mean_val, inplace=True)

这是用来查看需要补充的列

list(df.columns[df.isnull().sum() > 0])
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/170010.html原文链接:https://javaforall.net

(0)
上一篇 2022年8月12日 上午10:00
下一篇 2022年8月12日 上午10:00


相关推荐

  • 基本介绍LINUX远程PC软件:PUTTY、SecureCRT、X-Manager

    基本介绍LINUX远程PC软件:PUTTY、SecureCRT、X-Manager

    2022年1月2日
    57
  • 时滞/延迟微分方程(delay-differential equation)

    时滞/延迟微分方程(delay-differential equation)问题原来微分方程里面还有一类比较特殊复杂的。delaydifferentialequation(维基).翻了几篇相关的硕士和博士论文,感觉用处不大。不过,用软件做出来效果比较漂亮。与之相关的,分支或分叉(bifurcation)是一个似乎在包括迭代的动力系统里面都普遍的一个概念。Wolfram关于这个概念的文档延迟微分方程是一种微分方程,其在当前时间的时间导数取决于它在以往时间的解

    2026年4月19日
    5
  • 较为详细的MUSIC算法原理及MATLAB实现

    较为详细的MUSIC算法原理及MATLAB实现DOA 估计算法 DOA DirectionOfA 波达方向定位技术主要有 ARMA 谱分析 最大似然法 熵谱分析法和特征分解法 特征分解法主要有 MUSIC 算法 ESPRIT 算法 WSF 算法等 MUSIC MultipleSign 算法 即多信号分类算法 由 Schmidt 等人于 1979 年提出 MUSIC 算法是一种基于子空间分解的算法 它利用信号子空间

    2026年3月20日
    3
  • VC编程来操纵Office[通俗易懂]

    VC编程来操纵Office[通俗易懂]使用VC编程来操纵Office。你可以实现诸如:Word文件打印、传送数据到Word文档、发送E-MAIL、自动产生表格、Excel数据统计、圆饼图,直方图显示、自动报表生成、播放幻灯、doc,txt,HTML,rtf文件转换、中文简繁体转换、拼音或笔画排序……只要是Office能够实现的功能,都可以在你写的程序中调用。仔细阅读下面的说明,并下载源文件进行参考,你就可以一步一步地掌握这个技

    2022年6月16日
    61
  • Visual Studio安装教程

    Visual Studio安装教程VisualStudio 安装教程前言 近来在学习 opencv3 编程入门 因为这本书里面都是由 c 实现的 所以就下载了 visualstudio 以备使用 一 官网下载官网下载地址 https visualstudio microsoft com zh hans downloads 因为是个人学习用途 所以我这里下载的是社区版本 下载下来的是一个 exe 文件双击打开后 会加载一些东西 最后出现下面的界面二 安装 visualstudio 一 更改安装路径首先 我们要设置

    2026年3月18日
    2
  • 在C#中如何读取配置文件[通俗易懂]

    在C#中如何读取配置文件[通俗易懂]在C#中如何读取配置文件

    2022年4月22日
    66

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号