NLP自然语言处理系列-音乐推荐系统实战 - 数据处理
本文进行音乐推荐系统案例实战,对音乐数据集进行数据清洗和特征提取,基于矩阵分解进行音乐推荐。
-
数据处理 读取音乐数据集,统计数据指标,选择文本信息特征
-
基于商品相似性的推荐 选择相似度计算方法,通过相似度来计算推荐结果
-
基于SVD矩阵分解的推荐 使用矩阵分解方法,快速高效得到推荐结果
目录
数据加载及读取
- 数据加载及读取
- 统计每个用户的播放量
-
- 查询用户的播放排名情况
- 统计每首歌曲的播放量
-
- 查询歌曲的播放排名情况
- 选取实验数据子集
- 加载音乐详细信息
- 清洗数据集
- 展示最流行的歌曲
- 最受欢迎的releases
- 最受欢迎的歌手
- 用户播放过歌曲的数据分布
import pandas as pd
import numpy as np
import time
import sqlite3
data_h