pycharm代码运行不显示结果_pycharm运行配置错误

pycharm代码运行不显示结果_pycharm运行配置错误我最近看了两节关于数据分析的课程,其中最基础也最重要的知识就是支持度,置信度和提升度了。而在打印提升度的相关信息时,我遇到了一些麻烦!老师用的是JupyterNotebook来演示,而我用的是pycharm(其实跟编译器没关系),然后打印提升度时我发现有很多数据我无法打印出来!只是给我留了半串省略号…我就纳闷了,到底是啥原因?shopping_basket={‘ID’:[1,2,3,4,5,6],’Basket’:[[‘Onion’,’Bee

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

我最近看了两节关于数据分析的课程,其中最基础也最重要的知识就是支持度,置信度和提升度了。而在打印提升度的相关信息时,我遇到了一些麻烦!

老师用的是 Jupyter Notebook 来演示,而我用的是pycharm(其实跟编译器没关系),然后打印提升度时我发现有很多数据我无法打印出来!只是给我留了半串省略号…我就纳闷了,到底是啥原因?

shopping_basket = { 
   
    'ID': [1, 2, 3, 4, 5, 6],
    'Basket':[
        ['Onion', 'Beer', 'Chicken', 'Drink', 'Burger', 'Chips', 'Disper'],
        ['Onion', 'Beer', 'Chicken', 'Burger', 'Chips', ],
        ['Onion', 'Chicken', 'Drink', 'Burger', 'Chips', 'Disper'],
        ['Onion', 'Chicken', 'Drink'],
        ['Beer', 'Chicken', 'Drink', 'Burger', 'Chips', 'Disper'],
        ['Drink', 'Burger', 'Chips', 'Disper']
    ]
}

retail = pd.DataFrame(shopping_basket)
print(retail)

# 数据集中都是由字符串组成的,需要转化成数值编码
# 用到了方法,默认情况删除某一行
retail_id = retail.drop('Basket', 1)
print(retail_id)

retail_Basket = retail.Basket.str.join(',')
print(retail.Basket)
print(retail.Basket.str)
print(retail_Basket)

retail_Basket = retail_Basket.str.get_dummies(',')
print(retail_Basket)

retail = retail_id.join(retail_Basket)
print(retail)

# 只考虑支持度,多种组合出现十分频繁
frequent_itemsets2 = apriori(retail.drop('ID', 1), use_colnames=True)
print(frequent_itemsets2)

# 因此用到提升度来筛选数据
rules2 = association_rules(frequent_itemsets2, metric='lift', min_threshold=1.5)
print(rules2)

打印结果如下:
提升度的打印结果
岂有此理,只给两个数据是什么鬼呀!我还做啥数据分析呀!于是百思不得解的我百度了一下,找到了原因:pandas是有相关的输出显示设置的!直接放出来!

抱歉,我这是做在onenote上面的笔记,是截图来的,可能视觉效果有些差!
打印相关的设置函数的参数
至于怎么使用这些参数呢?常用的打印相关设置函数有三种!

value = '参数值'

pd.set_option('参数名', value)  # 设置相关显示选项
pd.get_option('参数名', value)  # 获取相关显示选项
pd.reset_option('参数名', value)  # 恢复默认相关选项

我们观察一下打印结果可以判断出来,咱们应该是最大行数和最大宽度被限制了,因此我们只要写下这三行代码:

pd.set_option('display.max_columns', None)   # 显示完整的列
pd.set_option('display.max_rows', None)  # 显示完整的行
pd.set_option('display.expand_frame_repr', False)  # 设置不折叠数据

然后Run一下!看看打印了啥出来:
提升度打印结果
哇,太耐思了吧,这才叫数据分析嘛!前项集,后项集,支持度,提升度应有尽有!但是,兄弟们别乐极生悲啊!我们回头看看!当我们想打印自己构建的数据集的时候,可以看到咱们的数据被折叠了!又是可恶的省略号!

retail = pd.DataFrame(shopping_basket)
print(retail)

数据集打印结果

不过有了刚刚的处理经验之后,我已经学会了如何更改显示参数之类的了,我看了看那张表,emmmm,就是你了!
参数
我加上了这样的一行代码之后:

pd.set_option('display.max_columns', None)   # 显示完整的列
pd.set_option('display.max_rows', None)  # 显示完整的行
pd.set_option('display.expand_frame_repr', False)  # 设置不折叠数据
pd.set_option('display.max_colwidth', 100)

在这里插入图片描述
哇,我的世界变美好了!

好了,这就是我遇到的微不足道的问题了,希望能帮助想入门数据分析的同学!因为我没看过pandas直接操作,踩得坑都塌了,希望大家不要重蹈覆辙了!

既然都看到最后了,我就安利一个有很多优秀数据集的网站吧!谢谢大家费心看完我的博客!
数据集!!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/174327.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • datagrip激活码2021(JetBrains全家桶)

    (datagrip激活码2021)这是一篇idea技术相关文章,由全栈君为大家提供,主要知识点是关于2021JetBrains全家桶永久激活码的内容IntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,下面是详细链接哦~https://javaforall.net/100143.html0E14HXZ4QL-eyJsa…

    2022年3月28日
    209
  • Python 第三方模块 科学计算 SciPy模块1 简介,常数,IO「建议收藏」

    Python 第三方模块 科学计算 SciPy模块1 简介,常数,IO「建议收藏」一.介绍1.介绍:SciPy是1个Python开源库,在BSD授权下发布,主要用于数学/科学/工程计算.SciPy依赖于NumPy来提供方便快速的n维数组操作.组合使用NumPy+SciPy+Matplotlib可以在很大程度上替代MATLAB,并且功能更强大,编程更容易…

    2022年6月28日
    29
  • latex 双引号 “

    latex 双引号 “别在latex敲,在记事本上敲完后,拷贝到latex中。转载于:https://www.cnblogs.com/cmyg/p/9851425.html

    2022年6月25日
    20
  • html背景图片拉伸解决办法

    html背景图片拉伸解决办法html背景图片拉伸解决办法body{background-size:100%100%;//关键代码,直接拉伸背景图background-image:url(“img/99.jpg”);//背景图导入background-repeat:no-repeat;//不重复拉伸background-attachment:fixed;//此代码用于页面内容超出屏幕,

    2022年9月28日
    1
  • 下载并安装windows版本的Redis

    打开官网:https://redis.io/download发现官网名没有提供Windows版本,只有Linux版本,费了一番周折,说是GitHub上才有地址是:https://github.com/MicrosoftArchive/redis/tags貌似比Linux的版本有点滞后,应该不影响,下载最新版本吧先download,下载mis版这个网站在国外,…

    2022年4月6日
    69
  • Nginx负载均衡策略_nginx高可用集群和负载均衡集群

    Nginx负载均衡策略_nginx高可用集群和负载均衡集群nginx的负载均衡策略有4种:轮询(默认)最基本的配置方法,它是upstream的默认策略,每个请求会按时间顺序逐一分配到不同的后端服务器。参数有:项目Valuefail_timeout与max_fails结合使用max_fails设置在fail_timeout参数设置的时间内最大失败次数,如果在这个时间内,所有针对该服务器的请求都失败了,那么认为该服务器会被认为是停机了fail_time服务器会被认为停机的时间长度,默认为10s。backup标记该服

    2022年10月13日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号