Python数据处理案例

Python数据处理案例关于数据处理案例有两个 第一个案例是我整理到有道云上的 就直接剪切下来了 下面直接进入正题 案例 1 快餐数据案例 2 欧洲杯数据先进行数据探索 data info data describe 查看数据集是否有缺失值且哪个字段存在缺失值 可以用下面的代码 也可以用前面案例 1 缺失值那里提到的前两种方法 foriinrange d

关于数据处理案例有两个,第一个案例是我整理到有道云上的,就直接剪切下来了,下面直接进入正题~

案例1:快餐数据

Python数据处理案例

Python数据处理案例

Python数据处理案例

Python数据处理案例

Python数据处理案例

Python数据处理案例

Python数据处理案例

案例2:欧洲杯数据

Python数据处理案例

先进行数据探索 

data.info() data.describe() 

查看数据集是否有缺失值且哪个字段存在缺失值?可以用下面的代码,也可以用前面案例1缺失值那里提到的前两种方法

for i in range(data.shape[1]): if data.iloc[:,i].notnull().sum() != data.shape[0]: print('第%d列:字段%s 存在缺失值'%(i+1,data.columns[i]))

代码运行结果是

Python数据处理案例

对Clearances off line进行缺失值处理

首先查看Clearances off line字段

Python数据处理案例

统计其数字组成

data['Clearances off line'].value_counts()

Python数据处理案例

从统计结果可以看到,在Clearances off line这个字段中有11个值为0,3个值为1,1个值为2,故考虑采用众数(mode)填充缺失值

mode=data['Clearances off line'].mode() data['Clearances off line']=data['Clearances off line'].fillna(mode)

描述性统计

统计有多少球队参加了欧洲杯?

data.Team.count()

将数据集中的列Team, Yellow Cards和Red Cards单独存为一个名叫discipline的数据框

discipline=data[['Team','Yellow Cards','Red Cards']]

按照先Red Cards再Yellow Cards进行降序排序

discipline.sort_values(by=['Red Cards','Yellow Cards'])

计算每个球队拿到黄牌的平均值

data['Yellow Cards'].mean()

找出进球数大于6个的球队的数据

data[data['Goals']>6]

对比英格兰(England)、意大利(Italy)和俄罗斯(Russia)的射正率(Shooting Accuracy)

data['Shooting Accuracy'].[data.Team.isin(['England','ltaly','Russia'])]

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/233758.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • python 下载m3u8视频「建议收藏」

    python 下载m3u8视频「建议收藏」https://leetcode-cn.com/problems/course-schedule/solution/ke-cheng-biao-by-leetcode-solution/F12,打开开发者工具,清除会话记录,然后刷新网页下载该文件,内容如下:获取ts文件名称筛选出以“.ts”结尾的行有些情况下可能是以其他格式的文件,比如png,下载后修改后缀即可或者筛除以“#”开头的行…

    2022年6月20日
    23
  • idea激活码mac【在线注册码/序列号/破解码】

    idea激活码mac【在线注册码/序列号/破解码】,https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月19日
    49
  • PD快速充电协议(转)[通俗易懂]

    PD快速充电协议(转)[通俗易懂]来源-作者@:http://www.elecfans.com/d/647097.html建议读者阅读原文,确保获得完整的信息1.PD充电协议是什么意思    PD充电协议是USB-IF组织公布的功率传输协议,它可以使目前默认最大功率5V/2A的type-c接口提高到100W,同时谷歌宣布Android7.0以上的手机搭载的快充协议必须支持PD协议,意在统一快充市场。2.PD协议快充是什么意思   …

    2022年10月23日
    0
  • widthStep、width

    widthStep、widthwidthStep表示存储一行像素需要的字节数。widthStep必须是4的倍数,如果8U图像宽度为3,那么widthStep是4,加一个字节补齐。这个图像的一行需要4个字节,只使用前3个,最后一个空在那儿不用。也就是一个宽3高3的图像的imageData数据大小为4*3=12字节。转自:http://blog.sina.com.cn/s/blog_4b46937b0100

    2022年4月30日
    54
  • JAVA生成uuid_oracle uuid生成

    JAVA生成uuid_oracle uuid生成packagetest.demo1;importjava.util.UUID;publicclassUUIDUtil{ publicstaticStringcreatUUID(){ returnUUID.randomUUID().toString().replace(“-“,””); } publicstaticvoidmain(String[]

    2022年9月16日
    0
  • WIN10下 Tomcat安装及配置教程「建议收藏」

    WIN10下 Tomcat安装及配置教程「建议收藏」目录工具/原料方法/步骤注意事项工具/原料1,JDK:版本为jdk1.8我的下载文件里有,解压缩版的2,tomcat:版本为apache-tomcat-8.0.53-windows-x64.zip下载地址http://tomcat.apache.org/3,windows10,64bit方法/步骤一、安装JDK和Tomcat1,安装JDK:解压即可,…

    2022年5月12日
    45

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号