电影推荐算法---HHR计划
1,先看FM部分。
2,看看冷启动。
0,热门召回源。
1,男女召回源,年龄召回源,职业召回源,score最高。
2,男女年龄职业相互组合;
3,存入redis。天级别更新。
3,召回+排序先搞懂。
4,排序一个一个往里套。(按照电商的做法,rmse,auc)
----------问题讨论--------
1,目前进度都有哪些?
2,协同都是你们自己写的吗?
3,模型用了哪一个了?
4, jiaxin 后来的课程如何?有用的?
------1, 数据阶段----------
ratings.dat: user_id, movie_id, rating, timestamp
users.dat: user_id, gender, age, occupation(职业), zip-code
movie.dat: movie_id, title, genres(体裁).
------2, 先看FM。------------
1. 数据导入:python mkdata.py ratings.dat > ratings.fm
数据变换:1::1193::5::978300760 -> 5.000000 1:1 11193:1
2. 模型训练:python fm.py ratings.fm
3. 电影相似度:python sim_movies.py
4. 用户观影历史: python user_movies.py ratings.dat
5. 推荐电影:python recommend.py 1
--------3,所有排序一个一个往里套-----------
1,LR(不适用于此)
2,linear regression:
3,xgboost(也 for 一遍看看):
4,FM:
5, Wide & Deep:
6,GBDT + LR:
7, 网格搜索一下最好的。
--------4,召回部分学习----------------------
1,word2vec:
2,CF:
3,FM:
4,DNN: