电影推荐算法---HHR计划

1,先看FM部分。

2,看看冷启动。

     0,热门召回源。

     1,男女召回源,年龄召回源,职业召回源,score最高。

     2,男女年龄职业相互组合;

     3,存入redis。天级别更新。

3,召回+排序先搞懂。

4,排序一个一个往里套。(按照电商的做法,rmse,auc)

 

----------问题讨论--------

1,目前进度都有哪些?

2,协同都是你们自己写的吗?

3,模型用了哪一个了?

4, jiaxin 后来的课程如何?有用的?

------1, 数据阶段----------

ratings.dat: user_id, movie_id, rating, timestamp

users.dat: user_id, gender, age, occupation(职业), zip-code

movie.dat: movie_id, title, genres(体裁).

 

------2, 先看FM。------------

1. 数据导入:python mkdata.py ratings.dat > ratings.fm

   数据变换:1::1193::5::978300760 -> 5.000000 1:1 11193:1

2. 模型训练:python fm.py ratings.fm
3. 电影相似度:python sim_movies.py
4. 用户观影历史: python user_movies.py ratings.dat
5. 推荐电影:python recommend.py 1 

--------3,所有排序一个一个往里套-----------

1,LR(不适用于此)

2,linear regression:

3,xgboost(也 for 一遍看看):

4,FM:

5, Wide & Deep:

6,GBDT + LR:

7, 网格搜索一下最好的。

 

--------4,召回部分学习----------------------

 1,word2vec:

 2,CF:

 3,FM:

 4,DNN:

 

posted @ 2019-08-19 08:30  创业-李春跃-增长黑客  阅读(435)  评论(0编辑  收藏  举报