Pandas详解十之Dropna滤除缺失数据

Pandas详解十之Dropna滤除缺失数据约定 importpandas 滤除缺失数据 pandas 的设计目标之一就是使得处理缺失数据的任务更加轻松些 pandas 使用 NaN 作为缺失数据的标记 使用 dropna 使得滤除缺失数据更加得心应手 一 处理 Series 对象通过 dropna

约定:

import pandas as pd import numpy as np from numpy import nan as NaN 

滤除缺失数据

pandas的设计目标之一就是使得处理缺失数据的任务更加轻松些。pandas使用NaN作为缺失数据的标记。

使用dropna使得滤除缺失数据更加得心应手。

一、处理Series对象

  • 通过dropna()滤除缺失数据:
se1=pd.Series([4,NaN,8,NaN,5]) print(se1) se1.dropna() 

代码结果:

0 4.0 1 NaN 2 8.0 3 NaN 4 5.0 dtype: float64 0 4.0 2 8.0 4 5.0 dtype: float64 
  • 通过布尔序列也能滤除:
se1[se1.notnull()] 

代码结果:

0 4.0 2 8.0 4 5.0 dtype: float64 

二、处理DataFrame对象

处理DataFrame对象比较复杂,因为你可能需要丢弃所有的NaN或部分NaN。

df1=pd.DataFrame([[1,2,3],[NaN,NaN,2],[NaN,NaN,NaN],[8,8,NaN]]) df1 

代码结果:

0 1 2
0 1.0 2.0 3.0
1 NaN NaN 2.0
2 NaN NaN NaN
3 8.0 8.0 NaN
  • 默认滤除所有包含NaN:
df1.dropna() 

代码结果:

0 1 2
0 1.0 2.0 3.0
  • 传入how=‘all’滤除全为NaN的行:
df1.dropna(how='all') 

代码结果:

0 1 2
0 1.0 2.0 3.0
1 NaN NaN 2.0
3 8.0 8.0 NaN
  • 传入axis=1滤除列:
df1[3]=NaN df1 

代码结果:

0 1 2 3
0 1.0 2.0 3.0 NaN
1 NaN NaN 2.0 NaN
2 NaN NaN NaN NaN
3 8.0 8.0 NaN NaN
df1.dropna(axis=1,how="all") 

代码结果:

0 1 2
0 1.0 2.0 3.0
1 NaN NaN 2.0
2 NaN NaN NaN
3 8.0 8.0 NaN
  • 传入thresh=n保留至少有n个非NaN数据的行:
df1.dropna(thresh=1) 

代码结果:

0 1 2 3
0 1.0 2.0 3.0 NaN
1 NaN NaN 2.0 NaN
3 8.0 8.0 NaN NaN
df1.dropna(thresh=3) 

代码结果:

0 1 2 3
0 1.0 2.0 3.0 NaN
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/215706.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月18日 下午1:37
下一篇 2026年3月18日 下午1:38


相关推荐

  • 芯片行业未来_为什么中国没有自己的芯片架构

    芯片行业未来_为什么中国没有自己的芯片架构【CSDN编者按】随着设备扩展带来的效益越来越少,人们开始设计内置AI的系统,以在本地处理更多数据。芯片制造商正在研究一种新的结构,这种结构能够显著增加每能耗和每个时钟周…

    2025年9月29日
    7
  • Vue父子组件传值的方法[通俗易懂]

    Vue父子组件传值的方法[通俗易懂]1.父向子传值props父组件:<child:inputName="name">子组件:(1)props:{   inputName:String,   required:true  }(2)props:["inputName"]2.子组件向父组件传值$emit子组件: <span>{{childValue}}</s…

    2022年5月17日
    116
  • 国际邮箱有哪些比较出名_国际上比较认可的邮箱

    国际邮箱有哪些比较出名_国际上比较认可的邮箱经济全球化,越来越多的企业选择跨国贸易,包括外贸、物流、软件科技等行业。在和客户谈生意时,虽然邮箱这个工具不起眼,但是却有着举足轻重的作用,如TOM国际企业邮箱。什么国际邮箱靠谱?企业注册国际邮箱,一般选择企业邮箱。要说什么国际邮箱靠谱,首先考虑海外邮件收发稳定性,其次是安全性。和普通邮箱相比,TOM企业邮箱的国内外邮件收发更安全,拥有专属的收发信通道,邮件加密传输,让用户丝毫不会担心邮件安全。公司用邮箱来往的信息,大多为重要信息,最好能长期存储,无限容量的企业邮箱可长期存储,单次发送邮件附件最大2

    2026年2月25日
    6
  • 【Jqurey EasyUI+Asp.net】—DataGrid增加、删、更改、搜

    【Jqurey EasyUI+Asp.net】—DataGrid增加、删、更改、搜

    2022年1月15日
    49
  • 一般试卷的纸张大小是多少_考试试卷用的是什么尺寸的纸

    一般试卷的纸张大小是多少_考试试卷用的是什么尺寸的纸展开全部考试试卷常用的是A3尺寸的纸。相当于A4纸的两倍,也就是俗称8开的纸。扩展资料:纸张的规格是指纸张制成后,经过636f70793231313335323631343130323136353331333365666136修整切边,裁成一定的尺寸。过去是以多少“开”(例如8开或16开等)来表示纸张的大小,如今我国采用国际标准,规定以A0、A1、A2、B1、B2……等标记来表示纸张的幅面…

    2022年6月20日
    135
  • 豆包大模型2.0发布 彰显多模态AI技术优势

    豆包大模型2.0发布 彰显多模态AI技术优势

    2026年3月12日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号