wuyijia

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

文章分类 -  推荐算法随记

Matrix_factorization
摘要:1 import numpy as np 2 3 4 class matrix_factorization(): 5 def __init__(self,data:np.ndarray,numOfFeatures=2) -> None: 6 self.data = data 7 self.numOf 阅读全文

posted @ 2023-05-26 11:27 小吴要努力 阅读(9) 评论(0) 推荐(0) 编辑

推荐系统有关链接
摘要:1.机器学习实战——推荐系统 阅读全文

posted @ 2023-05-25 22:25 小吴要努力 阅读(6) 评论(0) 推荐(0) 编辑

中文分词
摘要:1.通过概率,中文词之间没有空格,所以实现中文搜索引擎,比英文多了一项分词的任务。 2.不同词在不同环境中表达的意思是不同的。 3.最常见的分词方法是基于词典匹配:最大长度查找(前向查找,后向查找 准确率会更高一些)。 4.Trie树常用于加速分词查找词典问题。(正向,反向) 5.切分词图。 6.P 阅读全文

posted @ 2023-05-21 14:21 小吴要努力 阅读(76) 评论(0) 推荐(0) 编辑

协同过滤user_cf、item_cf
摘要:1.推荐引擎/召回/match 》物品候选集 》过滤(业务需求、规则,不同策略的去重) 》排序(保证公平性) 》策略(增加解释性) 》推荐列表 【代码】 1.将训练数据存入到字典中,dict = {user_id1:{item_id1:score...}, user_id2:{item_id2:sc 阅读全文

posted @ 2023-05-19 23:14 小吴要努力 阅读(14) 评论(0) 推荐(0) 编辑

tf*idf、lcs
摘要:#tf*idf 1 import os 2 import math 3 4 file_path = './allfiles' 5 # print(os.listdir(file_path)) 6 stop_list = set() 7 with open('stop_list.txt', 'r', 阅读全文

posted @ 2023-05-19 14:44 小吴要努力 阅读(27) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示