【推荐系统】音乐推荐系统02

【推荐系统】音乐推荐系统02数据预处理爬取网易音乐数据 格式为 json 数据 抽取歌单名称 歌单 ID 收藏数 所属分类等歌单维度信息 歌曲 ID 歌曲名 歌手 歌曲热度等歌曲维度信息 做推荐系统常用的库 surprise lightfm 推荐系统的项目有 online 和 offline offline 可以使用 Python online 追求的是效率 key value 形式 可以使用 C 或者 Java 线上的一定要是最优的

数据预处理

  1. 爬取网易音乐数据,格式为json。
  2. 数据:抽取歌单名称、歌单ID、收藏数、所属分类等歌单维度信息。歌曲ID、歌曲名、歌手、歌曲热度等歌曲维度信息。
  3. 做推荐系统常用的库:surprise、lightfm
  4. 推荐系统的项目有online和offline。offline可以使用Python,online追求的是效率key-value形式,可以使用C++或者Java。线上的一定要是最优的。
  5. 做推荐的时候并不是实时的推荐,而是已经把要推荐的东西做好了,想做就做。
  6. 有些东西随着时间的推移变化比较大,歌曲和歌曲之间的相似度。但是有些东西的变化不会那么大,人喜欢某种类型的歌曲。
  7. 将数据转换成想要的格式:user:item:rating:timesamp等。
  8. 歌ID到歌曲名的映射,歌单ID到歌单名的映射。
  9. 推荐算法:aprior、协同过滤、SVD、NMF等。
  10. 相似度计算:jaccard similarity。交集的个数/并集的个数
  11. 支持不同的评估标准:mse、msd、fcp等

实现步骤

  • 计算物品之间的相似度
  • 品类匹配word2vec。牛仔裤,上衣。
  • 冷启动问题
  • 音乐基因
  • 针对用户做预测。每个人喜欢的歌曲是有时效性的,将每个人的歌曲按照听的时间顺序进行排序
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/227980.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月16日 下午8:04
下一篇 2026年3月16日 下午8:04


相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号