NLTK FreqDist

NLTK FreqDistFreqDisknltkFreqDisk函数能够统计数组当中单词出现的次数。text=[‘hadoop’,’spark’,’hive’,’hadoop’,’hadoop’,’spark’,’lucene’,’hadoop’,’spark’,’hive’,’hadoop’,’hadoop’,’spark’,’pig’,’zookeeper’,’flume’,’…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

FreqDisk

nltk FreqDisk函数能够统计数组当中单词出现的次数。

text = ['hadoop','spark','hive','hadoop','hadoop'
    ,'spark','lucene','hadoop','spark','hive'
    ,'hadoop','hadoop','spark','pig','zookeeper'
    ,'flume','stream','hadoop','hadoop','spark'
    ,'pig','zookeeper','flume','stream','hadoop'
    ,'hadoop','spark','pig','zookeeper','flume'
    ,'stream','hadoop','hadoop','spark','pig'
    ,'zookeeper','flume','stream','hadoop','hadoop'
    ,'spark','pig','zookeeper','flume','stream']
fdist = nltk.FreqDist(text)
for k in fdist:
    print(k+" "+str(fdist[k]))

Jetbrains全家桶1年46,售后保障稳定

hadoop 14
spark 8
hive 2
lucene 1
pig 5
zookeeper 5
flume 5
stream 5

FreqDisk::plot(n)

参数n,以折线图的方式展示频数最大的前n项数据。

fdist.plot(4)

在这里插入图片描述

FreqDisk::tabulate(n)

参数n,以表格的方式展示频数最大的前n项数据。

fdist.tabulate(5)

在这里插入图片描述

FreqDisk::most_common(n)

参数n,展示频数最大的前n项数据。

print(fdist.most_common(3))
[('hadoop', 14), ('spark', 8), ('pig', 5)]

FreqDisk::hapaxes()

展示频数最小的数据。

print(fdist.hapaxes())
['lucene']

FreqDisk::max()

展示频数最大的数据。

print(fdist.max())
hadoop
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/226787.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • linux内核编程接口小结(一)

    linux内核编程接口小结(一)1、下面两幅图描述了linux内核编程接口函数

    2022年10月8日
    6
  • AD中测量两点之间的距离

    AD中测量两点之间的距离

    2021年6月21日
    95
  • shell中的for循环用法详解

    shell中的for循环用法详解for命令:foriin的各种用法:foriin“file1”“file2”“file3”foriin/boot/*foriin/etc/*.confforiin$(seq-w10)–》等宽的01-10foriin{1..10}foriin$(ls)forIin$(

    2022年7月24日
    13
  • 激光slam综述_开源算法是什么意思

    激光slam综述_开源算法是什么意思点击上方“AI算法修炼营”,选择加星标或“置顶”标题以下,全是干货前面的话好久没有更新SLAM系列的文章了,前面我们讲到了激光SLAM技术。基于激光雷达的同时定位与地图构建技术(simu…

    2022年8月23日
    5
  • ubuntu18.04.1 NFS服务器

    1、安装NFS软件包zhang@zhang-virtual-machine:~$sudoapt-getinstallnfs-kernel-server//安装NFS服务器端zhang@zhang-virtual-machine:~$sudoapt-getinstallnfs-common//安装NFS客户端2、添加NFS共享目录把/nfsroot目录设…

    2022年4月13日
    72
  • 区块链与联邦学习的研究

    区块链与联邦学习的研究本文分别介绍了区块链与联邦学习的研究现状、架构和运行原理、主要技术及局限性,并针对区块链与联邦学习所存在的问题,通过分析区块链与联邦学习各自的特点,探讨了如何将区块链与联邦学习进行融合互补,介绍了两种融合模型及其应用场景。1区块链概述1.1 区块链的研究现状2008年10月,化名为“中本聪”的学者在密码学论坛上公开了《比特币:一种点对点的电子现金系统》一文[1],提出了利用PoW和时间戳机制构造交易区块的链式结构,剔除了可信第三方,实现了去中心化的匿名支付。比特币于2009年1月上线并发布创世块,.

    2025年9月20日
    7

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号