ValueError: Input contains NaN, infinity or a value too large for dtype(‘float64’).

ValueError: Input contains NaN, infinity or a value too large for dtype(‘float64’).笔者在使用LogisticRegression模型进行预测时,报错Traceback(mostrecentcalllast):File“D:/软件(学习)/Python/MachineLearing/taitannike/train.py”,line55,inpredicted_np=clf.predict(test_np)File“D:\Python\Anacon…

大家好,又见面了,我是你们的朋友全栈君。

笔者在使用LogisticRegression模型进行预测时,报错
Traceback (most recent call last):
File “D:/软件(学习)/Python/MachineLearing/taitannike/train.py”, line 55, in
predicted_np = clf.predict(test_np)
File “D:\Python\Anaconda\lib\site-packages\sklearn\linear_model\base.py”, line 281, in predict
scores = self.decision_function(X)
File “D:\Python\Anaconda\lib\site-packages\sklearn\linear_model\base.py”, line 257, in decision_function
X = check_array(X, accept_sparse=‘csr’)
File “D:\Python\Anaconda\lib\site-packages\sklearn\utils\validation.py”, line 573, in check_array
allow_nan=force_all_finite == ‘allow-nan’)
File “D:\Python\Anaconda\lib\site-packages\sklearn\utils\validation.py”, line 56, in _assert_all_finite
raise ValueError(msg_err.format(type_err, X.dtype))
ValueError: Input contains NaN, infinity or a value too large for dtype(‘float64’).
Age False
在这里插入图片描述

问题:pandas在处理数据时出现以下错误

ValueError: Input contains NaN, infinity or a value too large for dtype(‘float64’).

解决方法:

1、检查数据中是否有缺失值

例如,读取得到的原始数据如下
读取数据

data_test = pd.read_csv('test.csv')

检查数据中是否有缺失值

print(np.isnan(data_test).any())

Flase:表示对应特征的特征值中无缺失值
True:表示有缺失值
在这里插入图片描述

2、删除有缺失值的行

train.dropna(inplace=True)

然后再看数据中是否有缺失值
也可以根据需要对缺失值进行填充处理:
train.fillna(‘100’)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/139747.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 第八章:并发类容器之Queue

    第八章:并发类容器之Queue第八章:并发类容器之Queue

    2022年4月23日
    52
  • Gson序列化对象时排除字段

    Gson序列化对象时排除字段

    2022年1月31日
    38
  • 配置静态路由,动态路由,默认路由模式_默认路由为网络和掩码

    配置静态路由,动态路由,默认路由模式_默认路由为网络和掩码一、什么是路由路由(routing)是指分组从源到目的地时,决定端到端路径的网络范围的进程[1]。路由工作在OSI参考模型第三层——网络层的数据包转发设备。路由器通过转发数据包来实现网络互连。虽然路由器可以支持多种协议(如TCP/IP、IPX/SPX、AppleTalk等协议),但是在我国绝大多数路由器运行TCP/IP协议。路由器通常连接两个或多个由IP子网或点到点协议标识的…

    2025年12月4日
    2
  • 正版哈希值校验工具_电子证据哈希值校验

    正版哈希值校验工具_电子证据哈希值校验介绍常用的两个:1、Hash1.04特点:小巧方便快速。缺点:需要自己对比校验,不能粘贴哈希值自行校验对错。图片是汉化版的界面,原作者RobinKeir有个自己工具的网站就在软件标题栏的后面:http://keri.net。有兴趣的可以下载英文原版的,网速可能有点慢。2、IHasherv0.2特点:可以自行对比校验对错。缺点:没什么大缺点。看标题栏后面的网址就明白了,是m…

    2025年11月4日
    4
  • 关于Office弹窗+横幅提示“你的许可证不是正版,并且你可能是盗版软件的受害者…”的解决方案——以Office2019为例

    关于Office弹窗+横幅提示“你的许可证不是正版,并且你可能是盗版软件的受害者…”的解决方案——以Office2019为例文章目录遭遇问题未成功解决的错误方法解决方案附录-各个版本Office对应更换密钥Office2019版本Office2016版本Office2013版本遭遇问题        前一段时间,博主电脑的Office2019软件忽然开始在每次打开时弹出“你的许可证不是正版,并且你可能是盗版软件的受害者。使用正版Office,避免干扰并保护你的文件安全。”的弹窗+横幅提示,因为博主要准备答辩暂且搁置了这个问题。直到今天撰写材料

    2022年7月19日
    112
  • 局域网和广域网_简单的局域网怎么搭建

    局域网和广域网_简单的局域网怎么搭建局域网1、什么是局域网:局域网是封闭型的,可以由办公室内的两台计算机组成,也可以由一个公司内的上千台计算机组成。也称为内网。2、局域网怎么实现:以太网是全球使用最广泛的局域网技术,有线局域网通常通过双绞线(一般直接说网线)连接;无线局域网现在一般通过交换机、路由器实现。3、局域网可以干什么:局域网可以实现文件管理、应用软件共享、打印机共享、工作组内的日程安排、电子邮件和传真通信服务等功能。广域网1、什么是广域网:将各局域网或城域网连接起来便是广域网,也称为外网或公网。2、广域网怎么实现:现在的传

    2022年10月19日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号