山东大学舆情研究中心_舆情系统

全栈程序员-站长 • 2026年2月2日上午10:43 • 未分类 • 阅读 5

山东大学舆情研究中心_舆情系统项目结题总结一、项目背景二、技术要点三、功能介绍1、服务器端（1）启动服务器一、项目背景对于一所高校来说一个好的风评有着十分重要的作用，拥有一个良好的口碑，能吸引更多的生源、引进更多的人才，学校的综合素质能力也会因此提升，因此我们小组选择了《山东大学舆情分析系统》这一题目，通过搜集百度新闻、央视新闻、今日头条、齐鲁网、新浪、网易新闻、微博、知乎等网站的有关信息，对搜集到的文本信息所进行的分词、统计处理，将结果绘制成可视化的热度词条、情感倾向变化图，并实时展示在网站上，以此来更直观的了解山大的实时风评。

大家好，又见面了，我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元售后保障童叟无欺

一、项目背景

对于一所高校来说一个好的风评有着十分重要的作用，拥有一个良好的口碑，能吸引更多的生源、引进更多的人才，学校的综合素质能力也会因此提升，因此我们小组选择了《山东大学舆情分析系统》这一题目，通过搜集百度新闻、央视新闻、今日头条、齐鲁网、新浪、网易新闻、微博、知乎等网站的有关信息，对搜集到的文本信息所进行的分词、统计处理，将结果绘制成可视化的热度词条、情感倾向变化图，并实时展示在网站上，以此来更直观的了解山大的实时风评。

二、技术要点

在本项目中，我们主要选用python语言。

在爬虫方面，我们采用Scrapy爬虫框架，首先对上述若干带有搜索引擎的入口网站进行一级爬取，该层主要爬取网页中以“山东大学”为关键字的搜索结果

其次将对一级爬取中获得的网页链接进行二级爬取，该层主要爬取相关页面中的“相关推荐”、评论等内容。
在这里插入图片描述
对于大部分网站中常见的反爬虫技术，我们采用了请求头随机UA、资源延时下载、cookie保存状态等来掩盖我们的爬虫，防止其被反爬虫技术识别。

在分词方面，我们采用的是python的pkuseg库，并加入了我们自己生成的停用词词库、保留词词典等，以进一步优化分词结果。在情感分析方面，我们使用词的情感倾向表，通过各个词的权值对热词、评论进行情感分析。

在网页展示方面，我们采用了Vue的前端和Django的后端，以便能与爬虫和分词模块更好的兼容。

三、功能介绍

1、服务器端

（1）启动服务器

我们的项目是在python的虚拟环境中运行，目前运行过程已经可以脱离编译器。因此我们首先进入python虚拟环境，进入django项目目录下，输入：

python manage.py runserver 0.0.0.0:8080

在这里插入图片描述

（2）后台主系统（控制爬虫、分词、分析模块）

后台主系统将在服务器启动时自动开启
主系统将在每天凌晨4~5点开启核心系统（爬虫、分词、分析模块）
主系统可以使用以下命令：
- “start”：开启主系统
- “stop” / “end”：关闭主系统
- “exit”：退出主系统
- ”help“：查看帮助信息
在核心系统运行时，无法关闭、退出主系统

（3）关闭服务器

关闭服务器前，需优先关闭主系统，再手动关闭服务器cmd窗口

2、网页端——未登录

（1）首页

在这里插入图片描述

（2）总览

在这里插入图片描述

（3）登录 / 注册

在这里插入图片描述

3、网页端——用户端

（1）单个热词查询

在这里插入图片描述

（2）单个热词信息

在这里插入图片描述

（3）热词相关网页查询

在这里插入图片描述

（4）总览——登陆后

在这里插入图片描述

4、网页端——管理员端

（1）热词管理

在这里插入图片描述

（2）网页管理

在这里插入图片描述

（3）链接管理

在这里插入图片描述

（4）用户管理

在这里插入图片描述

（5）增加管理员

在这里插入图片描述

（6）管理后台主系

在这里插入图片描述

四、Github项目地址

https://github.com/STK425/django_vue

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/191387.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

idea快捷键设置成idea_idea快捷键设置

上一篇 2026年2月2日上午10:22

在c语言里0和1表示什么_’0’是什么意思c语言

下一篇 2026年2月2日上午11:01

Android启动性能优化——闪屏及Splash页

Android启动性能优化——闪屏及Splash页Android 启动性能优化闪屏及 Splash 页本文我们将分析如何使用系统闪屏和 Splash 页来提升 APP 的启动性能闪屏闪屏页是什么启动闪屏不仅仅可以作为品牌宣传页还能够减轻用户对启动耗时的感知但是如果使用不恰当将适得其反当点击桌面图标启动 APP 的时候程序会显示一个启动窗口一直到页面的渲染加载完毕如果程序的启动速度足够快我们看的闪屏窗口停留显示的时间则会很短但是当程序启动速度偏慢的时候这个启动闪屏可以一定程度上减轻用户等待的焦虑感避免用户过于轻易的关闭应用

全栈程序员-站长
2025年6月3日
6
python的遍历字符串的方式

python的遍历字符串的方式1）直接进行遍历strs=’abcd’forchinstrs:print(ch)2)利用下标遍历strs=’abcd’forindex,chinenumerate(strs):print(index,end=”)print(ch)3)利用range进行遍历strs=’abcd’forindexin…

全栈程序员-站长
2022年6月22日
57
双击文本没有被选中

双击文本没有被选中

全栈程序员-站长
2022年1月10日
49
linux查看java进程序号,linux查看java进程id

linux查看java进程序号,linux查看java进程idlinux 查看 java 进程 id 2021 01 3105 59 32 简介 php 去除 nbsp 的方法首先创建一个 PHP 代码示例文件然后通过 preg replace s nbsp xc2 xa0 strip tags val 方法去除所有 nbsp 即可推荐 PHP 视频教建站服务器这篇文章主要介绍了 linux 中如何查看系统进程具有

全栈程序员-站长
2026年3月19日
2
傅里叶级数与傅里叶变换公式推导「建议收藏」

傅里叶级数与傅里叶变换公式推导「建议收藏」首先，傅里叶分析是指把一个周期或非周期函数展开成一个个三角函数的叠加，如果是对其还没有基本概念的，可以看看傅里叶分析之掐死教程，这篇文章不依赖数学公式却又十分透彻地讲述了傅里叶分析的基本概念，十分值得一读。但如果先深入探讨其中的数学由来，接下来会讲述详细的数学推导。傅里叶级数三角函数系的正交性三角函数系：{1,sinx,cosx,sin2x,cos2x,…,sinnx,cosnx,…}，它由无数个sinnx和cosnx组成，其中n=0,1,2,…。正交性：∫−ππsin⁡nxcos⁡mxdx=0，

全栈程序员-站长
2022年7月17日
23
Java学习之spring MVC常用注解

Java学习之springMVC常用注解0x00前言续上篇文章的内容继续来记录springmvc会常用到的一些注解。0x01常用注解RequestParam注解@Controller

全栈程序员-站长
2021年12月12日
46

发表回复

关注全栈程序员社区公众号