python好玩的词云和Jieba库的使用

python好玩的词云和Jieba库的使用一 安装 jieba 库 gt pipinstallji 或者 pip3installj 二 jieba 库解析 jieba 库主要提供提供分词功能 可以辅助自定义分词词典 jieba 库中包含的主要函数如下 jieba cut s 精确模

一、安装jieba库

:\>pip install jieba #或者 pip3 install jieba

二、jieba库解析

jieba库主要提供提供分词功能,可以辅助自定义分词词典。

jieba库中包含的主要函数如下:

jieba.cut(s)                                                               精确模式,返回一个可迭代的数据类型

jieba.cut(s,cut_all=True)                                          全模式,输出文本s中所有可能的单词

jieba.cut_for_search(s)                                            搜索引擎模式,适合搜索引擎建立索引的分词结果

jieba.lcut(s)                                                              精确模式,返回一个列表类型,建议使用

jieba.lcut(s,cut_all=True)                                         全模式,返回一个列表类型,建议使用

jieba.lcut_for_search(s)                                           搜索引擎模式,返回一个列表类型,建议使用

jieba.add_word(w)                                                   向分词词典中增加新词w

三、用jieba库统计文本的词频

《流浪地球》是刘慈欣的一部作品。该书讲述了庞大的地球逃脱计划,逃离太阳系,前往新家园。从网上获取该书的文本文件,保存于桌面上,命名为“流浪地球。”

现统计其文本中出现次数最多的是个词语,源代码如下:

python好玩的词云和Jieba库的使用

运行程序后,输出结果如下:

python好玩的词云和Jieba库的使用

 

 故容易得知流浪地球中出现频次较高的词语

四、结合jieba库的词频统计制作词云图

1、准备工作:pip 安装 jieba , wordcloud ,matplotlib

2以阿Q正传为例:

源代码为:

python好玩的词云和Jieba库的使用

运行程序后,输出结果如下:

python好玩的词云和Jieba库的使用

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/232586.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • idea在线激活码(注册激活)「建议收藏」

    (idea在线激活码)JetBrains旗下有多款编译器工具(如:IntelliJ、WebStorm、PyCharm等)在各编程领域几乎都占据了垄断地位。建立在开源IntelliJ平台之上,过去15年以来,JetBrains一直在不断发展和完善这个平台。这个平台可以针对您的开发工作流进行微调并且能够提供…

    2022年3月26日
    426
  • 带通滤波器幅频特性曲线图_滤波器知识,你所要的,都在这里

    带通滤波器幅频特性曲线图_滤波器知识,你所要的,都在这里滤波器是一种选频装置,可以使信号中特定的频率成分通过,而极大地衰减其它频率成分。一、概述1、定义凡是可以使信号中特定的频率成分通过,而极大地衰减或抑制其他频率成分的装置或系统都称之为滤波器,相当于频率“筛子”。2、分类频率通带:能通过滤波器的频率范围。频率阻带:被滤波器抑制或极大地衰减的信号频率范围。截止频率:通带与阻带的交界点。2)按物理原理分:机械式、电路式;按处理信号分:模拟、数字3、滤波…

    2022年6月1日
    121
  • 选择性忽略的心理_选择性忽略是什么意思

    选择性忽略的心理_选择性忽略是什么意思Python:PyCharm选择性忽略PEP8警告PyCharm是个很强大的pythonIDE,PEP8的告警提示也很好用,但是函数名不能包含大写字母等少数几个规范真心觉得不好,如何取消呢?见下述步骤:在Ignorederrors中添加要忽略的告警ID。注意,要区分是属于coding还是naming。错误代码code samplemessage N801 classnamesshoulduseCapWordsconvention N8

    2022年8月29日
    2
  • 0xC000005读取发生访问冲突_vs读取访问权限冲突

    0xC000005读取发生访问冲突_vs读取访问权限冲突遇见这种问题一般都是空指针,即:指针里没有赋值~如果你对null进行操作就会产生空指针异常Objectobj=newObject();你要知道obj是一个Object指针变量,指向Object类的一个实例我们说obj是一个对象实质是它指向一个对象的首地址如果这个指针变量obj没有指向任何空间你调用它的方法和属性就会出错例如Objectobj=

    2022年9月27日
    2
  • 卧槽,javaCV不到十行代码实现图片OCR文字识别

    卧槽,javaCV不到十行代码实现图片OCR文字识别springboot 项目 pom 文件中添加以下依赖 https mvnrepositor com artifact org bytedeco javacv platform dependency groupId org bytedeco groupId artifactId javacv platform artifactId version 1 version dependency

    2025年7月15日
    6

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号