pandas的dropna方法_python中dropna函数

pandas的dropna方法_python中dropna函数本文概述如果你的数据集包含空值,则可以使用dropna()函数分析并删除数据集中的行/列。句法DataFrameName.dropna(axis=0,how=’any’,thresh=None,subset=None,inplace=False)参数轴:{0或’index’,1或’columns’},默认值0它采用int或字符串值作为行/列。输入可以是0和1(整数和索引),也可以是…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

本文概述

如果你的数据集包含空值, 则可以使用dropna()函数分析并删除数据集中的行/列。

句法

DataFrameName.dropna(axis=0, how=’any’, thresh=None, subset=None, inplace=False)

参数

轴:{0或’index’, 1或’columns’}, 默认值0

它采用int或字符串值作为行/列。输入可以是0和1(整数和索引), 也可以是列(字符串)。

0或”索引”:删除包含缺失值的行。

1或”列”:删除包含缺失值的列。

怎么样 :

当我们有至少一个不适用或所有不适用时, 它确定是否从DataFrame中删除行或列。

它只接受两种字符串值(” any”或” all”)。

any:如果任何值为null, 则删除行/列。

all:仅在所有值均为null时丢弃。

脱粒:

它采用整数值, 该值定义要减少的最小NA值量。

子集:

它是一个数组, 将删除过程限制为通过列表传递的行/列。

到位:

它返回一个布尔值, 如果它为True, 则会在数据帧本身中进行更改。

Return

它返回删除了NA条目的DataFrame。

对于演示, 首先, 我们获取一个csv文件, 该文件将从数据集中删除任何列。

import pandas as pd

aa = pd.read_csv(“aa.csv”)

aa.head()

输出

Name

Hire Date

Salary

Leaves Remaining

0 John Idle03/15/14

50000.0

10

1 Smith Gilliam

06/01/15

65000.0

8

2 Parker Chapman

05/12/14

45000.0

10

3 Jones Palin

11/01/13

70000.0

3

4 Terry Gilliam

08/12/14

48000.0

7

5 Michael Palin

05/23/13

66000.0

8

代码

# importing pandas module

import pandas as pd

# making data frame from csv file

info = pd.read_csv(“aa.csv”)

# making a copy of old data frame

copy = pd.read_csv(“aa.csv”)

# creating value with all null values in new data frame

copy[“Null Column”]= None

# checking if column is inserted properly

print(info.columns.values, “\n”, copy.columns.values)

# comparing values before dropping null column

print(“\nColumn number before dropping Null column\n”, len(info.dtypes), len(copy.dtypes))

# dropping column with all null values

copy.dropna(axis = 1, how =’all’, inplace = True)

# comparing values after dropping null column

print(“\nColumn number after dropping Null column\n”, len(info.dtypes), len(info.dtypes))

输出

[‘NameHire DateSalaryLeaves Remaining’]

[‘NameHire DateSalaryLeaves Remaining’

‘Null Column’]

Column number before dropping Null column

1 2

Column number after dropping Null column

1 1

上面的代码从数据集中删除了null列, 并返回了一个新的DataFrame。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/193302.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • jdbc sql拼接字符串[通俗易懂]

    jdbc sql拼接字符串[通俗易懂]Listlist=this.getJtN().queryForList( "selectcpdmdm,cpmcmcfromt_cpxxwhere zt_dm=’1’andcpdmin("+cp_dm+")orderbydm");这样写是错误的,‘’单引号表示字符串,“”双引号表示字符串拼接,所以应改为"selectcpdmdm,cpmcmcfro…

    2022年6月29日
    25
  • Java开发手册之模块命名「建议收藏」

    Java开发手册之模块命名「建议收藏」Java开发手册之模块命名

    2022年4月23日
    57
  • java事务回滚案例_java事务控制

    java事务回滚案例_java事务控制疑问,确实像往常一样在service上添加了注解 @Transactional,为什么查询数据库时还是发现有数据不一致的情况,想想肯定是事务没起作用,出现异常的时候数据没有回滚。于是就对相关代码进行了一番测试,结果发现一下踩进了两个坑,确实是事务未回滚导致的数据不一致。下面总结一下经验教训:Spring事务的管理操作方法编程式的事务管理实际应用中很少使用通过

    2022年8月30日
    6
  • autoconf产生Makefile流程

    autoconf产生Makefile流程生成Makefile的流程。参考http://www.ibm.com/developerworks/cn/linux/l-makefile/首先进入project目录,在该目录下运行一系列命令,创建和修改几个文件,就可以生成符合该平台的Makefile文件,操作过程如下:1)运行autoscan命令2)将configure.scan文件重命名为configure.

    2022年6月3日
    37
  • 西门子plc485通讯控制变频器_西门子300plc波特率怎么改

    西门子plc485通讯控制变频器_西门子300plc波特率怎么改品牌:Endaic型号:CHNet-S7300MD产品简介CHNetS7-S7300MD用于西门子S7-200/SMARTS7-200/S7-300/S7-400/西门子数控840D、840DSL等PLC的以太网数据采集,非常方便构建生产管理系统。CHNetS7-S7300MD不占用PLC编程口,即编程软件/上位机软件通过以太网对PLC数据监控和采集的同时,触摸屏可以通过扩展RS485口与PLC进行通讯。CHNetS7-S7300MD支持工控领域内绝大多数SCADA软件,支持西门子S7TCP.

    2022年10月8日
    4
  • matlab测试部分,验证、确认和测试 – MATLAB 和 Simulink 解决方案 – MATLAB & Simulink

    matlab测试部分,验证、确认和测试 – MATLAB 和 Simulink 解决方案 – MATLAB & Simulink请选择其一AlabamaAlaska美属萨摩亚APO/FPOAAAPO/FPOAEAPO/FPOAPArizonaArkansasCaliforniaCarolineIslandsColoradoConnecticutDelawareDistrictofColumbiaFlorida格鲁吉亚关岛HawaiiIdahoIllinoisIndianaIowaKansasKentuckyLo…

    2022年6月5日
    66

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号