python好玩的词云和Jieba库的使用

python好玩的词云和Jieba库的使用一 安装 jieba 库 gt pipinstallji 或者 pip3installj 二 jieba 库解析 jieba 库主要提供提供分词功能 可以辅助自定义分词词典 jieba 库中包含的主要函数如下 jieba cut s 精确模

一、安装jieba库

:\>pip install jieba #或者 pip3 install jieba

二、jieba库解析

jieba库主要提供提供分词功能,可以辅助自定义分词词典。

jieba库中包含的主要函数如下:

jieba.cut(s)                                                               精确模式,返回一个可迭代的数据类型

jieba.cut(s,cut_all=True)                                          全模式,输出文本s中所有可能的单词

jieba.cut_for_search(s)                                            搜索引擎模式,适合搜索引擎建立索引的分词结果

jieba.lcut(s)                                                              精确模式,返回一个列表类型,建议使用

jieba.lcut(s,cut_all=True)                                         全模式,返回一个列表类型,建议使用

jieba.lcut_for_search(s)                                           搜索引擎模式,返回一个列表类型,建议使用

jieba.add_word(w)                                                   向分词词典中增加新词w

三、用jieba库统计文本的词频

《流浪地球》是刘慈欣的一部作品。该书讲述了庞大的地球逃脱计划,逃离太阳系,前往新家园。从网上获取该书的文本文件,保存于桌面上,命名为“流浪地球。”

现统计其文本中出现次数最多的是个词语,源代码如下:

python好玩的词云和Jieba库的使用

运行程序后,输出结果如下:

python好玩的词云和Jieba库的使用

 

 故容易得知流浪地球中出现频次较高的词语

四、结合jieba库的词频统计制作词云图

1、准备工作:pip 安装 jieba , wordcloud ,matplotlib

2以阿Q正传为例:

源代码为:

python好玩的词云和Jieba库的使用

运行程序后,输出结果如下:

python好玩的词云和Jieba库的使用

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/232586.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • jsp学习笔记

    jsp学习笔记

    2021年10月3日
    45
  • java递归查询父节点_java递归例子

    java递归查询父节点_java递归例子一、需求项目里要让用户能够设置所选择教材的章课节,以针对章课节提供相应的题目供用户做题。设计:用户设置了教材后,首次登录,进行章节设置时。默认为用户选择第一章、第一课、第一节。思路:用户访问页面,章一栏显示所有章,课一栏显示第一章下所有课程,节一栏显示第一章、第一课下的所有节。然后获取用户当前选择的章课节信息。如果当前用户没有设置过该教材的章课节,就为其设置默认的第一章、第一课、第一节。数据库设计…

    2026年1月16日
    4
  • iTunes下载的固件在哪里_applemobiledevice安装不了

    iTunes下载的固件在哪里_applemobiledevice安装不了Keyword:iphone,itouch,ipad激活成功教程软件;installous和icabmobile 问题描述:今天使用Installous更新了iCabMobile浏览器后,发现Downloads里面的东西全都不见了,用ifile查看var/mobile/Documents/Installous目录下也没有Downloads文件夹了,遵循weiphone上的

    2026年2月4日
    3
  • 使用decode函数

    使用decode函数Decode函数使用:Oracle的decode函数蛮有意思,是oracle独有的,国际标准SQL中并没有decode函数。语法DECODE(col|expression,search1,result1[,search2,result2,…,][,default])例子SELECTproduct_id,DECODE(warehouse_id,1…

    2022年7月25日
    8
  • 博客园博客美化相关文章目录

    博客园博客美化相关文章目录

    2021年9月4日
    63
  • Python中通过PyPDF2实现PDF拆分「建议收藏」

    Python中通过PyPDF2实现PDF拆分「建议收藏」场景PyPDF2是一个纯pythonPDF库,能够分割、合并、裁剪和转换PDF文件的页面。它还可以向PDF文件中添加自定义数据、查看选项和密码。它可以从PDF检索文本和元数据,还可以将整个文件合并在一起。PyPDF21.26.0文档:https://pythonhosted.org/PyPDF2/实现使用pip安装pypddf2新建merged.pdf有两页…

    2022年6月23日
    34

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号