yyyyyyyyyyyyyyyyyyyy

博客园 首页 新随笔 联系 订阅 管理

2020年3月27日 #

摘要: 单机模式处理大数据的开源利器 1. LibFM 项目主页:http://www.libfm.org/ 2. svdfeature 项目主页:http://apex.sjtu.edu.cn/apex_wiki/svdfeature recsyschina上的介绍:http://www.resyschi 阅读全文
posted @ 2020-03-27 02:05 xxxxxxxx1x2xxxxxxx 阅读(303) 评论(0) 推荐(0) 编辑

摘要: 构建训练集流程 一、前述 根据前文中架构,本文我们讨论线下部分构建训练集部分。因为我们离线部分模型的选择是逻辑回归,所以我们数据必须有x和y. 二、具体流程 1.从数据库中分离出我们需要的数据。 用户行为表(日志) 用户历史下载表 商品词表(商品的基本特征) 2.构建训练集中的关联特征 流程: 2. 阅读全文
posted @ 2020-03-27 01:10 xxxxxxxx1x2xxxxxxx 阅读(534) 评论(0) 推荐(0) 编辑

摘要: 训练模型 一、前述 经过之前的训练数据的构建可以得到所有特征值为1的模型文件,本文将继续构建训练数据特征并构建模型。 二、详细流程 将处理完成后的训练数据导出用做线下训练的源数据(可以用Spark_Sql对数据进行处理)insert overwrite local directory '/opt/d 阅读全文
posted @ 2020-03-27 01:01 xxxxxxxx1x2xxxxxxx 阅读(723) 评论(0) 推荐(0) 编辑

摘要: Problem 1 : Is it a loop ? (判断链表是否有环?) Assume that wehave a head pointer to a link-list. Also assumethat we know the list is single-linked. Can you co 阅读全文
posted @ 2020-03-27 00:30 xxxxxxxx1x2xxxxxxx 阅读(180) 评论(0) 推荐(0) 编辑