山东大学舆情研究中心_舆情系统

山东大学舆情研究中心_舆情系统项目结题总结一、项目背景二、技术要点三、功能介绍1、服务器端(1)启动服务器一、项目背景对于一所高校来说一个好的风评有着十分重要的作用,拥有一个良好的口碑,能吸引更多的生源、引进更多的人才,学校的综合素质能力也会因此提升,因此我们小组选择了《山东大学舆情分析系统》这一题目,通过搜集百度新闻、央视新闻、今日头条、齐鲁网、新浪、网易新闻、微博、知乎等网站的有关信息,对搜集到的文本信息所进行的分词、统计处理,将结果绘制成可视化的热度词条、情感倾向变化图,并实时展示在网站上,以此来更直观的了解山大的实时风评。

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺


一、项目背景

对于一所高校来说一个好的风评有着十分重要的作用,拥有一个良好的口碑,能吸引更多的生源、引进更多的人才,学校的综合素质能力也会因此提升,因此我们小组选择了《山东大学舆情分析系统》这一题目,通过搜集百度新闻、央视新闻、今日头条、齐鲁网、新浪、网易新闻、微博、知乎等网站的有关信息,对搜集到的文本信息所进行的分词、统计处理,将结果绘制成可视化的热度词条、情感倾向变化图,并实时展示在网站上,以此来更直观的了解山大的实时风评。

二、技术要点

在本项目中,我们主要选用python语言。

在爬虫方面,我们采用Scrapy爬虫框架,首先对上述若干带有搜索引擎的入口网站进行一级爬取,该层主要爬取网页中以“山东大学”为关键字的搜索结果
在这里插入图片描述
其次将对一级爬取中获得的网页链接进行二级爬取,该层主要爬取相关页面中的“相关推荐”、评论等内容。
在这里插入图片描述
对于大部分网站中常见的反爬虫技术,我们采用了请求头随机UA、资源延时下载、cookie保存状态等来掩盖我们的爬虫,防止其被反爬虫技术识别。

在分词方面,我们采用的是python的pkuseg库,并加入了我们自己生成的停用词词库、保留词词典等,以进一步优化分词结果。在情感分析方面,我们使用词的情感倾向表,通过各个词的权值对热词、评论进行情感分析。

在网页展示方面,我们采用了Vue的前端和Django的后端,以便能与爬虫和分词模块更好的兼容。

三、功能介绍

1、服务器端

(1)启动服务器

我们的项目是在python的虚拟环境中运行,目前运行过程已经可以脱离编译器。因此我们首先进入python虚拟环境,进入django项目目录下,输入:

python manage.py runserver 0.0.0.0:8080

在这里插入图片描述

(2)后台主系统(控制爬虫、分词、分析模块)

  • 后台主系统将在服务器启动时自动开启
  • 主系统将在每天凌晨4~5点开启核心系统(爬虫、分词、分析模块)
  • 主系统可以使用以下命令:
    • “start”:开启主系统
    • “stop” / “end”:关闭主系统
    • “exit”:退出主系统
    • ”help“:查看帮助信息
  • 在核心系统运行时,无法关闭、退出主系统

(3)关闭服务器

关闭服务器前,需优先关闭主系统,再手动关闭服务器cmd窗口

2、网页端——未登录

(1)首页

在这里插入图片描述

(2)总览

在这里插入图片描述

(3)登录 / 注册

在这里插入图片描述
在这里插入图片描述

3、网页端——用户端

(1)单个热词查询

在这里插入图片描述

(2)单个热词信息

在这里插入图片描述
在这里插入图片描述

(3)热词相关网页查询

在这里插入图片描述

(4)总览——登陆后

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4、网页端——管理员端

(1)热词管理

在这里插入图片描述

(2)网页管理

在这里插入图片描述

(3)链接管理

在这里插入图片描述

(4)用户管理

在这里插入图片描述

(5)增加管理员

在这里插入图片描述

(6)管理后台主系

在这里插入图片描述

四、Github项目地址

https://github.com/STK425/django_vue

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/191387.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 【福利】JVM系列学习资源无套路赠送「建议收藏」

    这段时间一直整理并输出JVM相关的内容,每次发文后,后台也总有小伙伴留言说不知道如何学习JVM,看书太枯燥,很难坚持下去,并且看了很多时候用不上,也都忘记的差不多了,究竟要怎么学习JVM的知识呢?其实我也是去年才开始意识到自己到学一下JVM了,自己买了一些书然后在网上找了一些相关的视频资源! 通过先看一遍书,大致整个JVM相关的内容体系,然后在通过视频的学习快速的对核心的知识进行熟悉。最后在过一…

    2022年2月28日
    41
  • [精选]详细介绍MySQL中常见的锁

    [精选]详细介绍MySQL中常见的锁

    2022年2月19日
    45
  • 九、命令模式—使用命令控制奶茶店中酷炫的灯 #和设计模式一起旅行#

    请不要用命令的口吻关系你在乎的人 — dufy故事背景在巴厘岛开的奶茶店开张后,生意很红火,每天都要忙到很晚,晚上就要打开奶茶店的酷炫的灯,由于安装了不同的灯,灯的开关都不在一个地方,那么需要打开和关闭所有的灯就很麻烦。作为老板的我,每天都要去开灯和关灯,这种粗活可不能交给设计模式MM去做啊。(pS:每个灯一个开关,并且不在一个地方,每次只能打开一个或者关闭一个灯)。我将上…

    2022年2月27日
    40
  • 杭州电子科技大学Online Judge 之 “确定比赛名次(ID1285)”解题报告

    杭州电子科技大学Online Judge 之 “确定比赛名次(ID1285)”解题报告

    2022年1月27日
    39
  • 面试题 垃圾分类_前端垃圾回收机制面试题

    面试题 垃圾分类_前端垃圾回收机制面试题一、垃圾回收对象JVM运行时的数据区包括程序计数器、栈、堆、方法区、本地方法栈其中程序计数器、栈和本地方法栈是和线程绑定在一起的,当创建了线程,就会申请内存,当线程结束的时候,想关的内存就会被销毁。方法区主要是类对象,类加载的时候就会申请这里的内存,“类卸载”操作实际上是很少会涉及到的。因此,垃圾回收机制主要回收的对象就是堆,并且垃圾回收释放内存,实际上是在以对象为单位进行释放,因为内存的申请是以对象为单位进行申请的,当整个对象的内存都不在使用时,即没有引用指向这个对象时,就可以将其进行释放二、垃圾

    2022年10月13日
    0
  • 重绘与回流_html回流重绘

    重绘与回流_html回流重绘文章目录css图层图层创建的条件重绘(Repaint)回流触发重绘的属性触发回流的属性常见的触发回流的操作优化方案requestAnimationFrame—-请求动画帧写在最后css图层浏览器在渲染一个页面时,会将页面分为很多个图层,图层有大有小,每个图层上有一个或多个节点。也就是我们各种各样的Dom标签在渲染DOM的时候,浏览器所做的工作实际上是:1.获取DOM后分割为多个图层2.对每个图层的节点计算样式结果 (Recalculatestyle–样式重计算)3.为每个节点生

    2022年10月24日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号