中文词频统计

中文词频统计红楼梦高频词:红楼梦整篇小说:成功排序出高频词:生成词云如下:

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

主要代码如下:
排序出高频词
#
-*- coding: utf-8 -*-""" from wordcloud import WordCloudimport matplotlib.pyplot as plt import jieba article = open('hlm.txt',encoding='UTF-8').read() dele = {'。','!','?','】','“','”','(',')',' ','》','《',','} jieba.add_word('贾宝玉') words = list(jieba.cut(article)) articleDict = {} articleSet = set(words)-dele for w in articleSet: if len(w)>1: articleDict[w] = words.count(w) articlelist = sorted(articleDict.items(),key = lambda x:x[1], reverse = True) cut_text = " ".join(words) 'print(cut_hlm)' mywc = WordCloud().generate(cut_hlm) plt.imshow(mywc)plt.axis("off") plt.show() ''' for i in range(20): print(articlelist[i]) import pandas as pd pd.DataFrame(data=articlelist).to_csv('test.csv',encoding='UTF-8') '''

红楼梦高频词:

中文词频统计

红楼梦整篇小说:

中文词频统计

成功排序出高频词:

中文词频统计

生成词云如下:

中文词频统计

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/167736.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • install scim to ubuntu

    install scim to ubuntu

    2021年4月23日
    182
  • Springmvc执行流程介绍[通俗易懂]

    Springmvc执行流程介绍[通俗易懂]1.什么是MVCMVC是ModelViewController的缩写,它是一个设计模式。2.springmvc执行流程详细介绍第一步:发起请求到前端控制器(DispatcherServlet)第二步:前端控制器请求HandlerMapping查找Handler,可以根据xml配置、注解进行查找第三步:处理器映射器HandlerMapping向前端控制器返回Handler第四步:前端控制器调用处理器适配器去执行Handler第五步:处理器适配器去执行Handler第

    2022年6月28日
    28
  • Linux 解压zip命令「建议收藏」

    Linux 解压zip命令「建议收藏」linux自带的unzip命令可以解压windows下的zip格式的压缩文件。unzip命令  语法:unzip[选项]压缩文件名.zip  各选项的含义分别为:  -x文件列表解压缩文件,但不包括指定的file文件。  -v查看压缩文件目录,但不解压。  -t测试文件有无损坏,但不解压。  -d目录把压缩文件解到指定目录下。  -z只显示压缩文件

    2022年5月23日
    44
  • 一窥直播技术新趋势「建议收藏」

    一窥直播技术新趋势「建议收藏」历经2016直播元年的爆发,直播App的虚火逐步降温,行业逐渐恢复理性,并不断探索新的产品形态与创新。这其中,技术扮演了不可或缺的角色,新的编码与传输协议,覆盖全球的网络架构,低延迟的音频传输与白板,基于深度学习的图像识别等,这一切进一步加强了各直播参与方的互动。基于Html5的直播技术,AR/VR,H.265编码普及,高清直播成本进一步降低,人工智能等技术又将让直播充满了更多想象。

    2022年7月21日
    14
  • java初学者Win 10下eclipse的安装教程(超级详细)

    java初学者Win 10下eclipse的安装教程(超级详细)安装的前准备首先查看电脑的位数方法:1.同时按Win键+R键,在打开的运行窗口中输入“dxdiag”,并确定。(Win键就是键盘上显示WINDOWS标志的按键)可以看到系统是64位的,等会要按照位数下载安装适合自己系统的vs下载安装JDK(由于jdk9和eclipse适配现在有问题这里安装jdk8)1.打开Oracle的官网http://www.oracle.com/techne

    2022年5月25日
    32
  • NetworkManager详解

    NetworkManager详解直接继承自 MonoBehaviour, 还有就是被设计成了单例 singletonNetworkManager网络管理器是一个方便的HLAPI类,用于管理网络系统。       对于简单的网络应用NetworkManager网络管理器可以使用HLAPI控制。它提供了简单的方法来 启动和停止 客户端和服务器,以及管理场景,而且具有虚拟函数,用户代码可以使

    2022年10月5日
    4

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号