python+Django+Mysql+协同过滤电影推荐系统简介

python+Django+Mysql+协同过滤电影推荐系统简介电影推荐系统技术采用前端:bootstrap3+vue+jquery后端:django2.2.1+djangorestframework(MVC框架)数据库:mysql数据集:豆瓣数据集+豆瓣电影爬虫+csv存储movielens数据集+图片+用户数据和评分数据+csv存储功能介绍录入电影信息用户打分电影标签分类电影推荐电影分享电影收藏后台管理系统。算法基于用户的协同过滤算法:协同过滤,根据用户的打分来进行推荐。从所有打分的用户中找

大家好,又见面了,我是你们的朋友全栈君。

该系统为基于协同过滤算法的Django电影推荐系统, 点击跳转 详情介绍如下所示。

技术介绍

  • 前端: bootstrap3 + jquery.js
  • 后端: django 2.2.1 + djangorestframework(负责api部分)
  • 数据库: mysql5.7 / sqlite3
  • 算法: 基于用户的协同过滤/基于物品的协同过滤

数据集介绍

豆瓣数据集

基于requests的python爬虫去抓取豆瓣电影的电影信息,包含图片信息,总共2250部。
数据属性:
id,title ,image_link ,country ,years ,director_description,leader,star ,description,all_tags,imdb,language,time_length
数据库展示
评分: 附带随机生成数据的脚本,可以随机生成指定数目的用户和用户的评分

movielens数据集

movielens 100k数据集+图片

数据维度: movieId,title,genres,picture
电影数量: 37544
评分数量: 93202+
movielens数据集+图片+用户数据和评分数据+csv存储

功能介绍

电影展示,电影搜索,标签分类

在这里插入图片描述

标签分类

在这里插入图片描述

用户的登录,注册,修改信息

用户注册界面

在这里插入图片描述

用户登录界面

在这里插入图片描述

用户个人信息

在这里插入图片描述

用户注册代码

在这里插入图片描述

用户对电影的打分,收藏和电影的详情页面

在这里插入图片描述

基于user和Item的协同过滤推荐算法,为用户推荐想看的电影

用户推荐界面

在这里插入图片描述

用户推荐部分代码在这里插入图片描述

物品推荐界面

在这里插入图片描述

物品推荐部分代码

在这里插入图片描述

后台管理系统,可以进行电影信息的增删改查

在这里插入图片描述

数据库模型代码

在这里插入图片描述

算法介绍

冷启动问题解决

在用户首次注册的时候会为用户提供感兴趣的标签选择界面。然后在用户未进行打分的情况下,会为用户推荐喜欢标签的电影。
在这里插入图片描述

推荐算法改进—-结合标签的协同过滤推荐

在冷启动页面用户选择标签后将用户对这些标签标签的喜爱值设为5。
在用户为电影打分后,会根据此电影的标签来更新用户对标签喜爱值得分。
在根据协同过滤得到为用户推荐的电影后,如果推荐的电影数量不足15部,则从用户喜爱的标签中选取一部分电影来填充
更新标签喜爱值的策略将用户对电影的打分值减三然后加到喜爱值表中。

基于用户的协同过滤

算法: 协同过滤, 根据用户的打分来进行推荐。从所有打分的用户中找出和当前用户距离最近的n用户,然后从n个用户打分的电影中找15个当前用户未看过的电影。
最近距离算法通过协同过滤来实现。
推荐算法—协同过滤 – 简书 此项目采用的是皮尔逊相关系数来计算相似度。采取基于用户模型的的协同过滤(Neighbor-based Collaborative Filtering)。
皮尔森距离公式:
在这里插入图片描述

基于物品的协同过滤

计算物品之间的相似度,然后根据相似度来推荐

物品间的共现矩阵,两个物品同时被n个用户购买
物品间的相似度
在这里插入图片描述

相似度:共现值/N的点赞值M的点赞值 开根号
推荐值: 相似度
评分
根据用户点赞过得商品来寻找相似度推荐。
计算每个点赞过的物品和所有未点赞物品之间的得分。得分=相似度*打分值
得分越高表示越相似。 然后返回结果

基于tensorflow/文本卷积网络的推荐

通过movielens所提供的用户信息: 年龄—性别—职业。这三个数据维度来刻画用户数据信息。然后构造文本卷积网络来生成模型。用户可以根据自己的年龄/性别等特征信息来得到个性化的推荐。

网络的第一层是词嵌入层,由每一个单词的嵌入向量组成的嵌入矩阵。下一层使用多个不同尺寸(窗口大小)的卷积核在嵌入矩阵上做卷积,窗口大小指的是每次卷积覆盖几个单词。这里跟对图像做卷积不太一样,图像的卷积通常用2×2、3×3、5×5之类的尺寸,而文本卷积要覆盖整个单词的嵌入向量,所以尺寸是(单词数,向量维度),比如每次滑动3个,4个或者5个单词。第三层网络是max pooling得到一个长向量,最后使用dropout做正则化,最终得到了电影Title的特征。
在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/132055.html原文链接:https://javaforall.net

(0)
上一篇 2022年6月11日 下午1:16
下一篇 2022年6月11日 下午1:16


相关推荐

  • jenkins教程_1 简介「建议收藏」

    jenkins教程_1 简介「建议收藏」文章内容https://gitee.com/fakerlove/jenkins文章目录1.简介1.1介绍1.2环境准备1.2.1安装jenkins1)离线安装2)docker安装3)访问jenkins1.2.2安装gitlab一、安装及配置1.gitlab镜像拉取2.运行gitlab镜像3.配置4.创建一个项目二、用户使用1.下载git.exe2.登录gitlab网页3.设置ssh4.从gitlab克隆代码5.提交代码到gitlab1.2.3gitlab占用内存太多问题1.简.

    2022年5月15日
    39
  • 备份集中的数据库备份与现有数据库不同 3154错误

    备份集中的数据库备份与现有数据库不同 3154错误本文转自【https://www.cnblogs.com/worfdream/articles/2174785.html】

    2022年6月9日
    100
  • linux使用make编译_linux load

    linux使用make编译_linux loadpetalinuxinstall1.新装系统后需要设置su密码:方法sudopasswd提示“EnternewUNIXpassword”退出root:su用户名2.修改Ubuntu的软件源,改成国内的服务器地址,这里选择了aliyun,然后执行sudoapt-getupdatesudoapt-getupgradedash->bash修改/bin/sh,因为ubuntu默认的“/bin/sh”是dash,需要修改成bash$ls-al/bin/

    2025年10月26日
    4
  • ubuntu卸载JDK

    ubuntu卸载JDK1.要删除OpenJDK,检查是安装的哪个OpenJDK包#dpkg–list|grep-ijdk2.移除openjdk包#apt-getpurgeopenjdk*3.卸载OpenJDK相关包#apt-getpurgeicedtea-*openjdk-*4.检查所有OpenJDK包是否都已卸载完毕#dpkg–list|grep-ijdk注:如果权限不够,就在前面加上sudo。…

    2022年6月25日
    29
  • 生成随机字符串

    生成随机字符串生成随机字符串

    2026年3月26日
    1
  • celery启动命令_不root卸载系统软件

    celery启动命令_不root卸载系统软件这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML图表FLowchart流程图导出与导入导出导入欢迎使用Ma…

    2022年8月10日
    60

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号