中文词频统计

中文词频统计红楼梦高频词:红楼梦整篇小说:成功排序出高频词:生成词云如下:

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

主要代码如下:
排序出高频词
#
-*- coding: utf-8 -*-""" from wordcloud import WordCloudimport matplotlib.pyplot as plt import jieba article = open('hlm.txt',encoding='UTF-8').read() dele = {'。','!','?','】','“','”','(',')',' ','》','《',','} jieba.add_word('贾宝玉') words = list(jieba.cut(article)) articleDict = {} articleSet = set(words)-dele for w in articleSet: if len(w)>1: articleDict[w] = words.count(w) articlelist = sorted(articleDict.items(),key = lambda x:x[1], reverse = True) cut_text = " ".join(words) 'print(cut_hlm)' mywc = WordCloud().generate(cut_hlm) plt.imshow(mywc)plt.axis("off") plt.show() ''' for i in range(20): print(articlelist[i]) import pandas as pd pd.DataFrame(data=articlelist).to_csv('test.csv',encoding='UTF-8') '''

红楼梦高频词:

中文词频统计

红楼梦整篇小说:

中文词频统计

成功排序出高频词:

中文词频统计

生成词云如下:

中文词频统计

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/167736.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • java8 Lambda表达式

    java8 Lambda表达式java8 Lambda表达式

    2022年4月23日
    45
  • BroadcastReceive基础知识总结「建议收藏」

    BroadcastReceive基础知识总结「建议收藏」1、普通广播2、有序广播3、粘性广播4、电量、开机广播

    2022年6月20日
    31
  • Redis的bind的误区

    Redis的bind的误区今天在搭建 Redis 服务集群的时候 发现自己一直以来对 Redis 中 bind 的理解的一个误区 在今天以前 我一直认为 Redis 中的配置文件中的 bind 的作用是 用来限制 Redis 服务器用来接收来自哪些服务器 IP 地址 的 Redis 连接请求 即 只有在 bind 指定的 IP 地址的计算机才可以访问这个 Redis 服务器 直到今天我才知道以上的理解都是错误 例如 bind127 0 0 1

    2025年10月30日
    5
  • oracle数据库的拼接字符串,Oracle数据库拼接字符串

    oracle数据库的拼接字符串,Oracle数据库拼接字符串Ora-03113\Ora-03114与OracleIn拼接字符串的问题刚深入接触Oracle不久(大学里以及刚参加工作时学到的Oracle知识只能算是皮毛),因为之前使用SqlServer有将近两年的时间,对SqlServer相对来说很熟悉,比较而言,Oracle真心很…oracle数据库分割字符串返回结果集函数CREATEORREPLACEFUNCTION…

    2022年9月20日
    2
  • 软件工程保研浙江大学、南京大学、同济大学、中山大学经验分享

    软件工程保研浙江大学、南京大学、同济大学、中山大学经验分享一、个人基本情况学校:某末流985专业:信息管理与信息系统排名:1平均成绩:91.23科研与比赛:一个国家级大创,互联网+国家级银奖,一篇论文(未发表),还有一堆没用什么用的水奖二、保研经验分享1.中山大学数据科学与计算机学院我参加的是中山大学的夏令营,最后的结果是考核合格(拟录取)。由于疫情原因,所以这次让我们做了一个进行自我介绍的PPT,面试时间总共为20分钟,有8—10分钟的时间进行PPT自述(中文),讲解完后老师会用英文提问,当时问我的问题是:介绍你最喜欢的城市、介绍

    2022年7月25日
    50
  • 2020vue面试题及答案_人际关系面试题及答案

    2020vue面试题及答案_人际关系面试题及答案1、虚拟DOM中key的作用:key是虚拟DOM对象的标识,当状态中的数据发生变化时,Vue会根据【新数据】生成【新的虚拟DOM】,随后Vue进行【新虚拟DOM】的差异比较,比较规则如下:2、key的对比规则:1、旧虚拟DOM中找到了与新虚拟DOM相同的key:若虚拟DOM中内容没变,直接使用之前的真实DOM若虚拟DOM中内容变了,则生成新的真实DOM,随后替换掉页面中之前的真实DOM………

    2025年8月31日
    4

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号