07 2020 档案

摘要:Factorization machine,因子分解机,把所有特征进行高阶组合,减少人工参与特征组合的工作, 在 LR 的基础上考虑交叉项,某些特征经过关联之后,与 label 的相关性会提高,比如球类运动配件和男性这两个特征。所以 FM 解决的问题是1.特征稀疏 2.特征组合 一般线性模型无法学习 阅读全文
posted @ 2020-07-15 22:27 rjxuu 阅读(419) 评论(0) 推荐(0)
摘要:LR是线性模型,学习能力有限,此时特征工程尤其重要。现有的特征工程主要集中在寻找有区分度的特征、特征组合,但未必会有效果提升。 GBDT的算法特点可以用来发掘有区分度的特征、特征组合,减少特征工程中的人力成本。相当于将决策树的路径作为LR的输入特征,对于树的每条路径,都是通过最大增益分割出来的有区分 阅读全文
posted @ 2020-07-15 22:23 rjxuu 阅读(230) 评论(0) 推荐(0)
摘要:基于离线训练的推荐系统架构 离线训练指使用历史一段时间(一周或几周)的数据进行训练,模型迭代的周期较长(一般以小时为单位),模型拟合的是用户的中长期兴趣。基于离线训练的推荐系统常用的算法有LR、GBDT、FM 一个典型的基于离线训练的推荐系统由数据上报、离线训练、在线存储、实时计算、AB测试几个模块 阅读全文
posted @ 2020-07-13 22:35 rjxuu 阅读(652) 评论(0) 推荐(0)
摘要:推荐系统中不得不说的双塔模型 阅读全文
posted @ 2020-07-13 22:30 rjxuu 阅读(600) 评论(0) 推荐(0)
摘要:详细教程https://www.jianshu.com/p/e57a4a2cf077 分布式的版本控制系统,Distributed Version Control Systems (DVCS)会把代码仓库完整地镜像下来,这样任何一个服务器发生故障,都可以用其他的仓库来修复。 CVCS 每个版本存放的 阅读全文
posted @ 2020-07-06 22:43 rjxuu 阅读(111) 评论(0) 推荐(0)
摘要:节点(Node)表示数学操作,多维数据数组,也就是张量(tensor),由线(edges)联系,表示节点之间的输入输出关系 计算图computational graph是TF中很重要的一个概念,其是由一系列节点(nodes)组成的图模型,每个节点对应的是TF的一个算子(operation)。每个算子 阅读全文
posted @ 2020-07-06 21:17 rjxuu 阅读(124) 评论(0) 推荐(0)
摘要:转自https://zhuanlan.zhihu.com/p/34436165 Spark 运算比 Hadoop 的 MapReduce 框架快的原因是因为 Hadoop 在一次 MapReduce 运算之后,会将数据的运算结果从内存写入到磁盘中,第二次 Mapredue 运算时在从磁盘中读取数据, 阅读全文
posted @ 2020-07-06 10:28 rjxuu 阅读(166) 评论(0) 推荐(0)
摘要:数组 字符串 链表 树 哈希 栈 队列 图 概率 二分 排序 动规 回溯 双指针 贪心算法 Boyer-Moore算法 拓扑排序 partition 二进制 大数据 其他 阅读全文
posted @ 2020-07-05 10:52 rjxuu 阅读(116) 评论(0) 推荐(0)
摘要:cat #连接文件并打印到标准输出设备上 rmdir #删除目录 mv #文件重命名或移动文件 more #类似cat,不过会以一页一页的形式显示 less #与more类似,但是more只能向前移动,而less可以随意浏览 diff #比较文件差异 cp #复制文件或目录,-f覆盖,-r复制文该目 阅读全文
posted @ 2020-07-03 15:56 rjxuu 阅读(88) 评论(0) 推荐(0)
摘要:java程序是半编译半解释的,目的是为了跨平台。C++程序是直接编译为本地机器语言代码。 R进制转十进制:各位数字与权相乘,积相加;十进制转R进制:除以R取余;十进制小数转R进制小数:乘以R取整; 补码:0的表示唯一,符号位可以直接参与运算。正整数原码就是补码,负整数补码是反码加一 反码:符号位不变 阅读全文
posted @ 2020-07-02 17:11 rjxuu 阅读(219) 评论(0) 推荐(0)
摘要:#小tip 传参时,如果接受的不是元组或列表,但想把元组或列表传入,可在前面加*。如果想把dict传入(关键字参数),可在前面加** python面向对象 class Employee: '所有员工的基类' empCount = 0 #类变量,它的值在这个类的所有实例之间共享 def __init_ 阅读全文
posted @ 2020-07-02 15:56 rjxuu 阅读(217) 评论(0) 推荐(0)