Python中的pandas库简介及其使用

Python中的pandas库简介及其使用pandas 模块 pandas 是一个强大的分析结构化数据的工具集 它的使用基础是 Numpy 提供高性能的矩阵运算 用于数据挖掘和数据分析 同时也提供数据清洗功能 Pandas 中常见的数据结构有两种 SeriesDateFr 类似一维数组的对象 类似多维数组 表格数组 每列数据可以是不同的类型 索引包括列索引和行索引 Series 构建 Series ser o

pandas模块

pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。

Pandas中常见的数据结构有两种:

Series DateFrame
类似一维数组的对象, 类似多维数组/表格数组;每列数据可以是不同的类型;索引包括列索引和行索引。

Series

  • 构建Series:ser_obj = pd.Series(range(10))
  • 由索引和数据组成(索引在左
    <自动创建的>
    ,数据在右)。
  • 获取数据和索引:ser_obj.index; ser_obj.values
  • 预览数据: ser_obj.head(n);ser_obj.tail(n)

DateFrame

  • 获取列数据:df_obj[col_idx]或df_obj.col_idx
  • 增加列数据:df_obj[new_col_idx] = data
  • 删除列:del df_obj[col_idx]
  • 按值排序:sort_values(by = “label_name”)

常用方法

Count 非NA值得数量
describe 针对Series或各DataFrame列计算汇总统计
min\max 计算最小值和最大值
argmin\argmax 计算能够获取到最大值或最小值的索引位置
idxmin\idxmax 计算能够获取到最小值和最大值的索引值
quantile 计算样本的分位数(0-1)
sum 值得总和
mean 值得平均值
median 值的算术中位数(50%分位数)
mad 根据平均值计算平均绝对离差
var 样本值得方差
std 样本值得标准差
skew 样本值的偏度(三阶距)
kurt 样本值的峰度(四阶距)
cumsum 样本值的累计和
cummin\cummax 样本值的累计最大值和累计最小值
cumprod 样本值的累计积
diff 计算一阶差分(对时间序列很有用)
pct_change 计算百分数变化

处理缺失数据

  • Dropna()丢弃缺失数据
  • Fillna()填充缺失数据

数据过滤
Df[filter_condition]依据filter_condition(条件)对Df(数据)进行过滤。

绘图功能

Plot(kind,x,y,title,figsize) Kind(绘制什么形式的图),x(x轴内容),y(y轴内容),title(图标题),figsize(图大小) 

保存图片:plt.savefig()


"The fool doth think he is wise, but the wise man knows himself to be a fool." --威廉·莎士比亚

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/214962.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月18日 下午3:01
下一篇 2026年3月18日 下午3:02


相关推荐

  • 遍历 HashMap 的 5 种最佳方式

    遍历 HashMap 的 5 种最佳方式摘要今天分享下 遍历 HashMap 的 5 种最佳方式的一些基本知识 欢迎关注 在本文中 我们将通过示例讨论在 Java 上遍历 HashMap 的五种最佳方法 使用 Iterator 遍历 HashMapEntry 使用 Iterator 遍历 HashMapKeySe 使用 For each 循环迭代 HashMap 使用 Lambda 表达式遍历 H

    2026年3月18日
    2
  • INTELLIJ IDEA15.0.2激活码-激活码分享

    (INTELLIJ IDEA15.0.2激活码)本文适用于JetBrains家族所有ide,包括IntelliJidea,phpstorm,webstorm,pycharm,datagrip等。https://javaforall.net/100143.htmlIntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,上面是详细链接哦~S…

    2022年3月25日
    126
  • 阿里云部署 OpenClaw 教程

    阿里云部署 OpenClaw 教程

    2026年3月13日
    1
  • Set集合和数组转换「建议收藏」

    Set集合和数组转换「建议收藏」publicvoidsetToArray(){Set<String>set=newHashSet<>();//错误!!!!!String[]strsFalse=(String[])set.toArray();for(Stringstr:strsFalse){System.out.println(str);}//正确String[]strsTrue=s…

    2022年6月18日
    36
  • UML概述及UML图详解[通俗易懂]

    UML概述及UML图详解[通俗易懂]​UML概述一、UML简介(一)UML(UnifiedModelingLanguage)为面向对象软件设计提供统一的、标准的、可视化的建模语言。适用于描述以用例为驱动,以体系结构为中心的软件设计的全过程。(二)UML的定义包括UML语义和UML表示法两个部分。 1.UML语义:UML对语义的描述使开发者能在语义上取得一致认识,消除了因人而异的表达方法所造成的影响; 2.UML表…

    2025年8月21日
    6
  • Linux 抓包工具 tcpdump 用法

    Linux 抓包工具 tcpdump 用法Linux抓包工具tcpdump用法tcpdump采用命令行方式对接口的数据包进行筛选抓取,其丰富特性表现在灵活的表达式上。不带任何选项的tcpdump,默认会抓取第一个网络接口,且只有将tcpdump进程终止才会停止抓包。例如:tcpdump-nn-ieth0icmp下面是详细的tcpdump用法tcpdump选项它的命令格式为:tcpdump[-DenNqvX][-ccount][-Ffile][-iinterface][-rfile]

    2022年8月20日
    8

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号