蚂蚁学python-推荐系列 - 随笔分类 - Trouvaille_fighting

18 【实战】推荐系统依赖的数据源和特征工程

摘要：业务数据库->模型训练前端埋点日志->模型预估外部数据->统计报表输出归一化：变换到0-1之间分箱处理：分为不同阶段 one-hot:用于简单词语的分类 0，1分别对应nannv tf-idf:用于关键词对应行为的id列表：embedding向量化阅读全文

posted @ 2022-12-19 16:43 Trouvaille_fighting 阅读(109) 评论(0) 推荐(0)

17【实战】Python使用Faiss实现向量近邻搜索

摘要：1. windows安装faiss 只能安装cpu版本 conda install faiss-cpu -c pytorch 安装不上就换源找到这个文件.condarc 替换为以下代码 channels: - https://mirrors.tuna.tsinghua.edu.cn/anacond 阅读全文

posted @ 2022-12-19 15:36 Trouvaille_fighting 阅读(520) 评论(0) 推荐(0)

14 解决物品冷启动的问题

摘要：![image](https://img2023.cnblogs.com/blog/2520904/202212/2520904-20221216104432997-1973856289.png) ![image](https://img2023.cnblogs.com/blog/2520904/202212/2520904-20221216104834073-1160625642.png) ![ 阅读全文

posted @ 2022-12-16 11:02 Trouvaille_fighting 阅读(68) 评论(0) 推荐(0)

12 实现用户聚类推荐

摘要：用户聚类结果：key-用户ID,value-聚类数字将用户聚类结果结合历史日志生成热榜记录将计算结果缓存：正排列表存用户ID和聚类数字，倒排列表存聚类数字和推荐ITEM列表在线服务：由用户ID查找聚类数字，找到对应的列表阅读全文

posted @ 2022-12-16 10:42 Trouvaille_fighting 阅读(78) 评论(0) 推荐(0)

13 推荐系统API接口

摘要：![image](https://img2023.cnblogs.com/blog/2520904/202212/2520904-20221215095553524-492811013.png) ![image](https://img2023.cnblogs.com/blog/2520904/202212/2520904-20221215095746970-1322294019.png) 阅读全文

posted @ 2022-12-15 10:00 Trouvaille_fighting 阅读(111) 评论(0) 推荐(0)

11 实现矩阵分解的推荐

摘要：u2i由用户向量*物品向量得到 i2i由物品向量*物品向量得到阅读全文

posted @ 2022-12-15 09:53 Trouvaille_fighting 阅读(39) 评论(0) 推荐(0)

10 实现内容相似推荐

摘要：内容获取(存储MySQL)-进行分词（TF-IDF）-语义拓展-生成每篇文章的向量（出现对应的词及拓展的词就是1）-每篇文章最相似的topN的文章-缓存-提供服务看github案例中文的词库:ai.tencent.com/ailab/nlp/embedding.html 数据量小用提取关键词后可阅读全文

posted @ 2022-12-15 09:33 Trouvaille_fighting 阅读(63) 评论(0) 推荐(0)

9 推荐系统的AB测试

摘要：![image](https://img2023.cnblogs.com/blog/2520904/202212/2520904-20221214203943862-123321585.png) ![image](https://img2023.cnblogs.com/blog/2520904/202212/2520904-20221214204520950-645827210.png) ![im 阅读全文

posted @ 2022-12-14 21:09 Trouvaille_fighting 阅读(75) 评论(0) 推荐(0)

8 多路召回的融合排序

摘要：融合排序：将多种召回排序的列表进行融合为一个列表阅读全文

posted @ 2022-12-14 18:21 Trouvaille_fighting 阅读(564) 评论(0) 推荐(0)

7 实现基于协同过滤的推荐系统

摘要：u2u2i:u1,u2,u4都喜欢l1,l2,他们相似。u2,u4都喜欢l4,就向u1推荐l4。 u2i2i:u2,u4表示喜欢l2的也喜欢l3,所以u1喜欢l2的推荐给他l3。阅读全文

posted @ 2022-12-14 18:12 Trouvaille_fighting 阅读(109) 评论(0) 推荐(0)

6 实现基于内容的推荐系统

摘要：给物品找一个特征，得到一个向量根据用户的偏好，得到一个向量求两个向量的相似度，得到topN物品阅读全文

posted @ 2022-12-14 17:38 Trouvaille_fighting 阅读(48) 评论(0) 推荐(0)

5 推荐系统通用技术架构

摘要：![image](https://img2023.cnblogs.com/blog/2520904/202212/2520904-20221214170613553-2007047205.png) 阅读全文

posted @ 2022-12-14 17:11 Trouvaille_fighting 阅读(55) 评论(0) 推荐(0)

4 Netflix经典推荐系统框架

摘要：![image](https://img2023.cnblogs.com/blog/2520904/202212/2520904-20221214170406802-833468887.png) 阅读全文

posted @ 2022-12-14 17:05 Trouvaille_fighting 阅读(85) 评论(0) 推荐(0)

3 推荐系统的召回路径

摘要：U tag I 都表示结点，2表示边 i2i: 一个物品和另一个物品的相似度内容相似:取标题的关键字的相似度，推荐标题相似的文章基于行为->协同过滤、关联规则：发现ItemX和ItemY经常一起看，看过ItemX就推荐ItemY u2i:用户的直接行为推荐 u2i2i:两种方式结合 u2u2i: 阅读全文

posted @ 2022-12-14 12:40 Trouvaille_fighting 阅读(93) 评论(0) 推荐(0)

2 推荐系统包含哪些环节

摘要：召回：降低数量级、选取与用户直接相关/间接相关的粗略相关的内容排序：喜欢/不喜欢对应二分类的问题，按照概率进行排列，已经是精确的个性化了调整：进一步细节优化数据量不多的话，可以直接抛给排序阶段对数据进行排序，效果也不错阅读全文

posted @ 2022-12-14 11:43 Trouvaille_fighting 阅读(68) 评论(0) 推荐(0)

1 推荐系统的介绍

摘要：一、推荐系统是什么定义：根据用户的历史信息和行为，向用户推荐他感兴趣的内容方法：用户1喜欢钢铁侠，绿巨人与钢铁侠近，推荐绿巨人用户1与用户3相近，将用户3喜欢的蝙蝠侠推荐给用户1 根据用户看过的内容，依据内容的标签，推荐具有相同内容标签的电影和课程推荐系统解决了什么问题阅读全文

posted @ 2022-12-14 11:00 Trouvaille_fighting 阅读(63) 评论(0) 推荐(0)

Trouvaille

持续学习...

随笔分类 - 蚂蚁学python-推荐系列

公告