01 2018 档案

摘要:在做阿里的o2o优惠券预测的时候学习了GBDT。听闻GBDT的威力,自然要学习学习。 接下来从以下几个方面记录下我对于GBDT的理解。 GBDT的用途,优势 GBDT的结构和算法流程 GBDT如何训练 Sklearn 的GBDT使用,参数意义 GBDT的用途,优势: GBDT(Gradient Bo 阅读全文
posted @ 2018-01-24 15:51 Earendil 阅读(403) 评论(0) 推荐(1) 编辑
摘要:1、使用pip简单安装 First, make sure you obtained gcc-5 (newer version does not work with this method yet). Note: installation of gcc can take a while (~ 30 m 阅读全文
posted @ 2018-01-23 11:21 Earendil 阅读(189) 评论(0) 推荐(1) 编辑
摘要:XGBoost 与 Boosted Tree http://www.52cs.org/?p=429 作者:陈天奇,毕业于上海交通大学ACM班,现就读于华盛顿大学,从事大规模机器学习研究。 注解:truth4sex 编者按:本文是对开源xgboost库理论层面的介绍,在陈天奇原文《梯度提升法和Boos 阅读全文
posted @ 2018-01-19 14:51 Earendil 阅读(231) 评论(0) 推荐(0) 编辑
摘要:new_value = (value - min)/(max-min) 阅读全文
posted @ 2018-01-18 18:09 Earendil 阅读(4504) 评论(0) 推荐(0) 编辑
摘要:前言: 刚开始看到线性回归,总觉得这是不是和罗辑回归又啥关系。 对比一下吧。 线性回归用于数值预测,罗辑回归用于分类。 对于罗辑回归 来说,用于分类的神经网络的最后一层也是一个罗辑回归。 线性回归: 线性回归比较简单,找到一条最佳直线来拟合数据。拟合的目标可以是均方误差最小。 求最优的线性回归直线的 阅读全文
posted @ 2018-01-11 17:48 Earendil 阅读(200) 评论(0) 推荐(1) 编辑
摘要:(很多讲逻辑回归的文章都没有给出详细的推导,只是列出最后的计算公式,今天在网上看到一篇解释得非常详细的文章,赶紧转载一下: 【机器学习笔记1】Logistic回归总结(http://blog.csdn.net/dongtingzhizi/article/details/15962797) 作者说"未 阅读全文
posted @ 2018-01-11 15:40 Earendil 阅读(1310) 评论(4) 推荐(0) 编辑
摘要:KNN与Kmeans感觉没啥联系,但是名字挺像的,就拿来一起总结一下吧。 初学者的总结。 KNN是监督学习,Kmeans是无监督学习。 KNN用于分类,Kmeans用于聚类。 先说KNN: 对于KNN,有一批已经标注好label的训练样本,将这批样本的数据转换为向量表示,然后选择度量向量距离的方式。 阅读全文
posted @ 2018-01-10 09:53 Earendil 阅读(941) 评论(0) 推荐(0) 编辑
摘要:RDD全称叫做弹性分布式数据集(Resilient Distributed Datasets),它是一种分布式的内存抽象,表示一个只读的记录分区的集合,它只能通过其他RDD转换而创建,为此,RDD支持丰富的转换操作(如map, join, filter, groupBy等),通过这种转换操作,新的R 阅读全文
posted @ 2018-01-05 16:06 Earendil 阅读(655) 评论(0) 推荐(0) 编辑
摘要:基于邻域的算法是推荐系统中最基本的算法,该算法不仅在学术界得到了深入研究,而且在 业界得到了广泛应用。基于邻域的算法分为两大类,一类是基于用户的协同过滤算法,另一类是 基于物品的协同过滤算法。 基于用户的协同过滤算法: 该算法主要分为两个步骤: (1)找到和目标用户兴趣相似的用户的集合 (2)找到集 阅读全文
posted @ 2018-01-05 15:59 Earendil 阅读(2097) 评论(0) 推荐(0) 编辑
摘要:本文主要是基于《推荐系统实践》这本书的读书笔记,还没有实践这些算法。 LFM算法是属于隐含语义模型的算法,不同于基于邻域的推荐算法。 隐含语义模型有:LFM,LDA,Topic Model 这本书里介绍的LFM算法。书中内容介绍的很详细,不过我也是看了一天才看明白的。 开始一直没想明白,隐类的类别是 阅读全文
posted @ 2018-01-05 10:14 Earendil 阅读(10795) 评论(0) 推荐(1) 编辑
摘要:什么是好的推荐系统: 一个完整的推荐系统包括三部分用户,网站,内容提供方。 好的推荐系统设计,能够让推荐系统本身收集到高质量的用户反馈,不断完善推荐的质量,增加 用户和网站的交互,提高网站的收入。因此在评测一个推荐算法时,需要同时考虑三方的利益, 一个好的推荐系统是能够令三方共赢的系统。 推荐系统的 阅读全文
posted @ 2018-01-02 13:52 Earendil 阅读(4060) 评论(0) 推荐(0) 编辑
摘要:初学推荐系统相关内容,写写自己读《推荐系统实践》的读书笔记。 推荐系统: 对用户来说推荐系统帮助用户发现自己想要的商品,对于商品来说找到对其感兴趣的用户,前者例如电影,歌曲的推荐,后者例如广告推送。 产生推荐系统主要是因为信息过载,用户难以从大量信息中发现自己想要的信息。 对于物品来说,在线上购物网 阅读全文
posted @ 2018-01-02 12:52 Earendil 阅读(6311) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示