由于我在程序中设定文件打开的编码格式为“utf-8”,但是我后来用电脑的记事本打开这个”三国演义.txt”文件,然后在点击另存为的时候,发现原文件的编码方式是“ANSI”. 哦哦哦哦哦哦哦哦哦哦哦。。。。不报错才怪呢!
下面附上代码以及代码运行结果:
import jieba text=open('./三国演义1.txt',"r",encoding='utf-8').read() words=jieba.lcut(text) counts={} for word in words: if len(word)==1: #排除带个字符的分词效果 continue else: counts[word]=counts.get(word,0)+1 items=list(counts.items()) items.sort(key=lambda x:x[1],reverse=True) for i in range(15): word,count=items[i] print("{0:<10}{1:>5}".format(word,count))
曹操果然是男一号!!!
小记:学习过程中会遇到各种问题,有的时候往往就是这样的小问题让你很不舒服。然而,越是这种小问题,越是应该搞清楚,不能似是而非,一知半解。学习之路漫漫,求共勉!
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/224038.html原文链接:https://javaforall.net
