Python使用pandas读取excel表格数据

Python使用pandas读取excel表格数据导入importpandasaspd若使用的是Anaconda集成包则可直接使用,否则可能需要下载:pipinstallpandas读取表格并得到表格行列信息df=pd.read_excel(‘test.xlsx’)height,width=df.shapeprint(height,width,type(df))表格如下:得到如下输出,为一个4行5列的数据块:…

大家好,又见面了,我是你们的朋友全栈君。

导入

import pandas as pd

若使用的是Anaconda集成包则可直接使用,否则可能需要下载:pip install pandas

读取表格并得到表格行列信息

df=pd.read_excel('test.xlsx')
height,width = df.shape
print(height,width,type(df))

表格如下:
test.xlsx1
得到如下输出,为一个4行5列的数据块,为DataFrame格式:
输出
直接print(df)得到的结果:
print(df)
对比结果和表格,很显然表格中的第一行(黄色高亮部分)被定义为数据块的列下标,而实际视作数据的是后四行(蓝色高亮部分);并且自动在表格第一列之前加了一个行索引{0,1,2,3}。
test.xlsx2

提取数据放入数组中

x = np.zeros((height,width))
for i in range(0,height):
	for j in range(1,width+1): #遍历的实际下标,即excel第一行
		x[i][j-1] = df.ix[i,j]
print(x.shape)
print(x)

np.zeros()方法定义一个初试值全为0的二维数组(需要导入numpy库),用df.ix[i,j]读取数据并复制入二维数组中,其中for i in range(0,height)循环表示从下标0到下标height-1(不包含height),得到的输出如下:
输出

对代码做一些补充说明:

从DataFrame结构的数据中取值有三种常用的方法:

#第一种方法:ix
df.ix[i,j]		# 这里面的i,j为内置数字索引,行列均从0开始计数
df.ix[row,col]	# 这里面的row和col为表格行列索引,也就是表格中的行与列名称

#第二种方法:loc
df.loc[row,col]	# loc只支持使用表格行列索引,不能用内置数字索引

#第三种方法:iloc
df.iloc[i,j]	# iloc只支持使用内置数字索引,不能用表格行列索引

由于ix方法对两种索引都支持,所以这里就有一个问题:如果表格行列索引也是数字怎么办? 比如我上述例子中列索引为表格的第一行{1,2,3,4},而行索引为读取时自动添加的。
经过实验这种情况将会优先使用表格行列索引,也就对应了上面代码中得到的结果。不过为了不在使用时产生混乱,我个人建议还是使用loc或者iloc而不是ix为好。

在表格中自定义行列索引的情况

如果表格是下面这样的形式:
新表格
想要让读取得到的DataFrame行索引为{‘one’,‘two’,‘three’,‘four’},列索引为{‘一’,‘二’,‘三’,‘四’,‘五’}。如果直接使用read_excel(filename),虽然列索引会默认为第一行,但是行索引并不会默认为第一列,而是会自动添加一个{0,1,2,3}作为行索引。因此需要达到我们的目的需要设定一下读取时的参数,如下:

df = pd.read_excel(filename,index_col=0)	# 即指定第一列为行索引
print(df)
print('第0行第1列的数据为:',df.iloc[0,1])
print('第three行第二列的数据为:',df.loc['three','二'])

得到的输出如下所示:
新dataframe

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/154163.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 游戏建模:3D建模的入门学习方法及技巧

    选一个你感兴趣的模型利用你感兴趣的任何物品或形象的预制模型。选一个可以激发你想象,让你知道清楚知道自己的模型该是什么样子,该怎么动的模型。你可以根据自己的喜好和需要加强现有模型。预制模型可以让你在开始建模之前,体验模型的检查和操作。从简单模型入手从复杂3D模型入手,你可能会备受打击。选一个简单的结构,然后开始学习。你不仅想要学会3D建模的基本知识,还需要慢慢学习掌握不同的工具、技巧。瓶子一样的圆柱体是一个很好的入门模型。或者你可以用更简单的立方体来熟悉所有工具技巧的用法。复杂模型可能会.

    2022年4月3日
    151
  • form factor_perform和performance的区别和用法

    form factor_perform和performance的区别和用法performSelector:withObject:是在iOS中的一种方法调用方式。他可以向一个对象传递任何消息,而不需要在编译的时候声明这些方法。所以这也是runtime的一种应用方式。performSelector和直接调用方法的区别就在与runtime。直接调用编译是会自动校验。如果方法不存在,那么直接调用在编译时候就能够发现,编译器会直接报错。但是使用performSelec…

    2025年8月2日
    4
  • 工作量证明(PoW)的内部攻击模型「建议收藏」

    工作量证明(PoW)的内部攻击模型「建议收藏」虽然,POW算法其实并没有协调选择博弈论中的安全性,因为多数联盟可以形成和有益的审查和回复块。但是当我们考虑PoW的攻击时,通常不会考虑到矿工联合攻击,而是想到购买矿工设备或者对更重链进行挖矿。这篇文章主要是谈论PoW对抗控制半数哈希力攻击的能力,不允许租用,或贿赂矿工,或与矿工进行任何其他形式的合作。外部攻击外部攻击者购买足够的GPU或者ASIC直到完成对可信网络的“51%攻击”,或者至少…

    2022年5月28日
    42
  • 图书馆管理系统程序测试计划

    图书馆管理系统程序测试计划

    2021年11月18日
    53
  • 海思hi3518ev300说明书_海思3516dv300方案开发

    海思hi3518ev300说明书_海思3516dv300方案开发1.硬件内置AudioCodec/外置FM1288,hi3516dv300为内置audiocodec,硬件上外接FM1288,通过MIC单端/差分输入音频.2.重要概念2.1.I2S相关概念(1)LRCLK(帧时钟,也称为WS) 当LRCLK为低电平时表示左声道,高电平时表示右声道, LRCLK的频率=采样频率(2)SCLK(串行时钟),也叫BCLK(位时钟);方波形式存在 对应数字音频的每一位数据,SCLK都有一个脉冲. SCLK的频率=2*采样频率*采样位数

    2022年9月23日
    3
  • mykit-db-sync之——数据库同步工具正式开源[通俗易懂]

    mykit-db-sync之——数据库同步工具正式开源[通俗易懂]转载请注明出处:https://blog.csdn.net/l1028386804/article/details/82731142重磅消息:数据库同步工具mykit-db-sync正式开源开源地址:https://github.com/sunshinelyz/mykit-db-sync框架简述mykit中分离出的强大的数据库同步工具——mykit-db-sync基于java开发…

    2022年6月16日
    44

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号