python dtype o_python – 什么是dtype(’O’)? – 堆栈内存溢出「建议收藏」

python dtype o_python – 什么是dtype(’O’)? – 堆栈内存溢出「建议收藏」当你在数据帧中看到dtype(‘O’),这意味着Pandas字符串。什么是dtype?什么属于pandas或numpy,或两者,或其他什么?如果我们检查一下pandas代码:df=pd.DataFrame({‘float’:[1.0],’int’:[1],’datetime’:[pd.Timestamp(‘20180310′)],’string’:[‘foo’]})print…

大家好,又见面了,我是你们的朋友全栈君。

当你在数据帧中看到dtype(‘O’) ,这意味着Pandas字符串。

什么是dtype ?

什么属于pandas或numpy ,或两者,或其他什么? 如果我们检查一下pandas代码:

df = pd.DataFrame({‘float’: [1.0],

‘int’: [1],

‘datetime’: [pd.Timestamp(‘20180310’)],

‘string’: [‘foo’]})

print(df)

print(df[‘float’].dtype,df[‘int’].dtype,df[‘datetime’].dtype,df[‘string’].dtype)

df[‘string’].dtype

它将输出如下:

float int datetime string

0 1.0 1 2018-03-10 foo

float64 int64 datetime64[ns] object

dtype(‘O’)

您可以将最后解释为Pandas dtype(‘O’)或Pandas对象,它是Python类型字符串,这对应于Numpy string_或unicode_ types。

Pandas dtype Python type NumPy type Usage

object str string_, unicode_ Text

就像堂吉诃德一样,Pandas在Numpy上,Numpy了解你的系统的底层架构,并使用类numpy.dtype 。

数据类型对象是numpy.dtype类的一个实例, numpy.dtype 更加精确地理解数据类型,包括:

数据类型(整数,浮点数,Python对象等)

数据的大小(例如整数中的字节数)

数据的字节顺序(little-endian或big-endian)

如果数据类型是结构化的,则是其他数据类型的聚合(例如,描述由整数和浮点数组成的数组项)

结构“字段”的名称是什么

每个字段的数据类型是什么

每个字段占用的内存块的哪一部分

如果数据类型是子数组,那么它的形状和数据类型是什么

在这个问题的上下文中, dtype属于pands和numpy,特别是dtype(‘O’)意味着我们期望字符串。

下面是一些用于测试和解释的代码:如果我们将数据集作为字典

import pandas as pd

import numpy as np

from pandas import Timestamp

data={‘id’: {0: 1, 1: 2, 2: 3, 3: 4, 4: 5}, ‘date’: {0: Timestamp(‘2018-12-12 00:00:00’), 1: Timestamp(‘2018-12-12 00:00:00’), 2: Timestamp(‘2018-12-12 00:00:00’), 3: Timestamp(‘2018-12-12 00:00:00’), 4: Timestamp(‘2018-12-12 00:00:00’)}, ‘role’: {0: ‘Support’, 1: ‘Marketing’, 2: ‘Business Development’, 3: ‘Sales’, 4: ‘Engineering’}, ‘num’: {0: 123, 1: 234, 2: 345, 3: 456, 4: 567}, ‘fnum’: {0: 3.14, 1: 2.14, 2: -0.14, 3: 41.3, 4: 3.14}}

df = pd.DataFrame.from_dict(data) #now we have a dataframe

print(df)

print(df.dtypes)

最后一行将检查数据帧并记下输出:

id date role num fnum

0 1 2018-12-12 Support 123 3.14

1 2 2018-12-12 Marketing 234 2.14

2 3 2018-12-12 Business Development 345 -0.14

3 4 2018-12-12 Sales 456 41.30

4 5 2018-12-12 Engineering 567 3.14

id int64

date datetime64[ns]

role object

num int64

fnum float64

dtype: object

各种不同的dtypes

df.iloc[1,:] = np.nan

df.iloc[2,:] = None

但是如果我们尝试设置np.nan或None这不会影响原始列dtype。 输出将如下所示:

print(df)

print(df.dtypes)

id date role num fnum

0 1.0 2018-12-12 Support 123.0 3.14

1 NaN NaT NaN NaN NaN

2 NaN NaT None NaN NaN

3 4.0 2018-12-12 Sales 456.0 41.30

4 5.0 2018-12-12 Engineering 567.0 3.14

id float64

date datetime64[ns]

role object

num float64

fnum float64

dtype: object

所以np.nan或None不会更改列dtype ,除非我们设置的所有列行np.nan或None 。 在这种情况下,列将分别成为float64或object 。

您也可以尝试设置单行:

df.iloc[3,:] = 0 # will convert datetime to object only

df.iloc[4,:] = ” # will convert all columns to object

在这里要注意,如果我们在非字符串列中设置字符串,它将变为字符串或对象dtype 。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/145171.html原文链接:https://javaforall.net

(0)
上一篇 2022年5月17日 下午9:40
下一篇 2022年5月17日 下午10:00


相关推荐

  • java类加载和初始化_java静态变量什么时候初始化

    java类加载和初始化_java静态变量什么时候初始化????Java学习路线配套文章:Java学习路线总结,搬砖工逆袭Java架构师(全网最强)????基础推荐:Java基础教程系列????实战推荐:SpringBoot基础教程????简介:Java领域优质创作者????、CSDN哪吒公众号作者✌、Java架构师奋斗者????????扫描主页左侧二维码,加入群聊,一起学习、一起进步????欢迎点赞????收藏⭐留言????目录一、类的加载与ClassLoader的理解1、加载2、链接3、初始化二、什么时候会发生类初始化1

    2022年8月11日
    8
  • 静态网站(博客)生成器(Static-Site-Generators)

    静态网站(博客)生成器(Static-Site-Generators)一.介绍静态网站生成器到底有多少呢?GitHub用户对静态博客生成程序进行了大规模总结,太多了啊,太恐怖,萌新被吓傻了……GitHub地址:https://github.com/pinceladasdaweb/Static-Site-Generators我选了jekyll博客,因为两大代码仓库GitHub(国外)和Coding(国内)都提供免费空间自动构建Jekyll网站!我的…

    2022年7月11日
    43
  • vm虚拟机安装ubuntu_vmware安装虚拟机

    vm虚拟机安装ubuntu_vmware安装虚拟机所需环境:VMware12Fedora12镜像文件1、新建虚拟机 2、选择自定义下一步,其实典型也差不多读者有兴趣可以试一试 3、默认即可,这里可以改VM兼容性,比如建立vm8 4、选择稍后安装操作系统 5、操作系统选择linux,版本选择Fedora 6、默认即可,路径也可以自己设置 7、核心选两个 8、建议选择1G以上

    2025年12月8日
    3
  • CDN加速是什么?具体有什么用?

    CDN加速是什么?具体有什么用?简介 了解和学习阿里云 CDN 的工作原理非常重要 这对于网站优化 解决用户问题都有非常大的帮助 本文主要介绍了阿里云 CDN 的加速原理和缓存策略 举了一些实际的例子方便读者能清晰地理解阿里云 CDN 什么是 CDNCDN 的全称是 ContentDeliv 即内容分发网络 CDN 是构建在现有网络基础之上的智能虚拟网络 依靠部署在各地的边缘服务器 通过中心平台的负载均衡 内容分发 调度等功能模块 使用户就近获取所需内容 降低网络拥塞 提高用户访问响应速度和命中率 CDN 的关键技术主要包括了节

    2026年3月17日
    3
  • 王思聪新浪微博微博_kimi乔任梁王思聪

    王思聪新浪微博微博_kimi乔任梁王思聪作者|天使不投资人本文经授权转载自虎嗅APP(ID:huxiu_com)iG夺冠了!iG夺冠了!——11月3日,社交媒体成为了年轻人欢乐的海洋,微博尤甚。根本不知道LOL、也不知道iG是什么的叔叔阿姨们,对这次刷屏一点都不反感,毕竟IG老板,人称“校长”的王思聪,为了庆祝自家战队创造历史,在11月6日发起了一场豪气抽奖:从参与人数就可以隔着屏幕感受到一万元奖金的巨大…

    2022年8月30日
    9
  • webservices原理

    webservices原理nbsp nbsp nbsp nbsp nbsp nbsp 无论是在计算机杂志还是在 Internet 上 目前最热门的话题莫过于 WebServices 各个平台之间的锋争 各个新产品的发布 众多新标准的制订 大都和 WebServices 有关 nbsp WebServices 的起源 Web 应用的巨大成功和不断发展 使其渗透到商业领域和个人生活的各个方面 人们只要使用浏览器 就可以享受到各种各样的 Web 服务 例如网上购物 网上交易 网络游戏

    2026年3月17日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号