SenticNet情感词典介绍[通俗易懂]

SenticNet情感词典介绍[通俗易懂]在进行情感分析时,一个好的情感词典能够让我们的工作事半功倍,较为出名的情感词典有SentiWordNet,GeneralInquirer等,这篇博客将介绍另外一个出色情感词典,SenticNet。简介当谈论SenticNet时,我们正在谈论概念层面的情感分析,即通过语义和语言学来完成极性探测、情感识别等任务,而不是单纯的依靠词共现频率。SenticNet可以看作是以下其中一种:1…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

在进行情感分析时,一个好的情感词典能够让我们的工作事半功倍,较为出名的情感词典有SentiWordNetGeneral Inquirer等,这篇博客将介绍另外一个出色情感词典,SenticNet

简介

当谈论SenticNet时,我们正在谈论概念层面的情感分析,即通过语义和语言学来完成极性探测、情感识别等任务,而不是单纯的依靠词共现频率。SenticNet可以看作是以下其中一种:
1)一个概念层次的知识库
2)一个多学科的框架
3)一家私人公司
作为一个知识库,SenticNet提供了一组语义、情感、极性关联的100,000个自然语言概念。特别地,语义指与输入概念在语义上最相关的概念(比如,与输入概念共享最多语义特征的五个概念),情感指四个情感维度(Pleasantness, Attention, Sensitivity, and Aptitude)的情感值和-1到+1之间的情感极性值(其中,-1表示极度负向,+1表示极度正向)。该知识库可作为独立的XML文件免费下载,其最新版本(SenticNet5)也可作为API访问
作为一个框架,SenticNet包含了一系列将常识推理、心理学、语言学和机器学习相结合的情感分析工具和技术。在这种情况下,SenticNet通常指senti computing,一种多学科范式,它超越了单纯的统计情感分析方法,通过关注自然语言概念的语义表示(semantic-preserving representation)和句子结构。
作为一家公司,SenticNet覆盖了概念层次情感分析的最新发现,以此为大型社交数据分析提供易用的、最先进的工具,从而在不同的领域,语言和形式下实现自动化任务,比如产品定位、趋势发现和社交媒体营销。

下载使用

SenticNet提供了各种类型、任务、语言的词典,都可以从该页面下载
最新的SenticNet5包含100,000个自然语言概念,可以通过以下三种途径获取。

下载RDF/XML格式或者txt格式到本地

下载的senticnet-5.0包含以下三个重要文件:
senticnet5.py。文件形式如下:


这里写图片描述

首先定义了一个senticnet字典,关键字key是概念,值value是一个列表,元素依次是四个情感维度值、两个情绪标签、极性标签和极性值以及最相似的五个概念。
senticnet5.rdf.xml。以rdf的格式组织每一个概念,形式如下:


这里写图片描述

senticnet5.txt。仅仅展示了每个概念的极性和极性强度值,形式如下:


这里写图片描述

通过API访问

通过API获取指定概念的基本方法是:http://sentic.net/api/LANGUAGE/concept/CONCEPT_NAME,其中LANGUAGE指俩字母格式的目标语言,CONCEPT_NAME可以是单独的单词也可以是通过下划线连接的多个单词。更细粒度的方法可以分别获取语义、情感 、情绪标签和极性:

其中polarity由value(正或负)和强度(-1到1之间的浮点数)组成,分别查询如下:

作为Python第三方类库调用

可以直接使用pip安装

pip install senticnet

也可以通过源码安装,在github或者Pypi上下载源码,然后采用如下命令安装。

python setup.py install

在windows上安装可能出现LINCENSE文件解码错误,这个时候用一个空的LINCENSE文件替换原文件即可。安装好后使用方法如下:

from senticnet.senticnet import SenticNet

sn = SenticNet()   # 可以指定语言参数,不写默认英语
concept_info = sn.concept('love')
polarity_value = sn.polarity_value('love')
polarity_intense = sn.polarity_intense('love')
moodtags = sn.moodtags('love')
semantics = sn.semantics('love')
sentics = sn.sentics('love')

参考文献

SenticNet主页

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/172436.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 用方框图来表示指令周期函数_加法指令周期流程图

    用方框图来表示指令周期函数_加法指令周期流程图这个方框图确实叫人头疼。

    2022年10月11日
    1
  • trunk口设置vlan_wan口配置什么意思

    trunk口设置vlan_wan口配置什么意思trunk口和VLAN

    2025年7月10日
    2
  • Android源码学习「建议收藏」

    Android源码学习「建议收藏」作为一名程序员,肯定不仅仅限于使用API文档,因为浮于表面是远远不够的。进阶学习的阶段,需要我们保持一颗好奇的心,深入阅读Android源码,学习优秀的代码风格和设计思想,知其然并且知其所以然。引用Google的一张框架图:Applications层,和用户直接交互的就是这些应用程序,它们都是用Java开发的。 JavaFramework层,这一层大部分用Java语言编写。它是An…

    2022年6月6日
    27
  • python图像轮廓识别_python数字图像处理

    python图像轮廓识别_python数字图像处理前面一篇文章介绍了图像分类知识,包括常见的图像分类算法,并介绍Python环境下的贝叶斯图像分类算法、基于KNN算法的图像分类和基于神经网络算法的图像分类等案例。这篇文章将详细讲解图像分割知识,包括阈值分割、边缘分割、纹理分割、分水岭算法、K-Means分割、漫水填充分割、区域定位等。万字长文整理,希望对您有所帮助。同时,该部分知识均为作者查阅资料撰写总结,并且开设成了收费专栏,为小宝赚点奶粉钱,感谢您的抬爱。当然如果您是在读学生或经济拮据,可以私聊我给你每篇文章开白名单,或者转发原文给你,更希望您能进步

    2022年10月7日
    4
  • nginx 日志管理「建议收藏」

    nginx 日志管理「建议收藏」打开nginx.conf配置文件我们观察nginx的server段,可以看到如下类似信息#access_loglogs/host.access.logmain;这说明该server,它的访问日志的文件是logs/host.access.log,使用的格式”main”格式.除了main格式,你可以自定义其他格式.main格式是什么?log_form…

    2022年5月27日
    34
  • 启动磁盘不能被分区或恢复成单个分区 mac_mac如何恢复成单个分区

    启动磁盘不能被分区或恢复成单个分区 mac_mac如何恢复成单个分区最近在MacbookPro2015款上面用bootcamp装了一个widow系统,因为一些不知道的原因,安装玩之后Mac还有一个OSXRESERVED磁盘,这个盘正常情况下安装完window会还给Mac,现在肯定是出现了一些问题。在终端里面输入diskutillist看到#:TYPENAMESIZE

    2022年8月11日
    13

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号