01 2017 档案

摘要:摘要:   1.正则化(Regularization)     1.1 正则化的目的       1.2 正则化的L1范数(lasso),L2范数(ridge),ElasticNet   2.归一化 (Normalization)     2.1归一化的目的     2.1归一化计算方法       2.2.spark ml中的归一化     2.3 python中skelearn中的归一化 阅读全文
posted @ 2017-01-18 23:14 混沌战神阿瑞斯 阅读(12796) 评论(0) 推荐(0)
摘要:摘要:   1.各个数据结构的应用举例    1.1 String类型应用举例    1.2List类型应用举例    1.3Set类型应用举例    1.4Sorted Set类型应用举例    1.5Hash类型应用举例 阅读全文
posted @ 2017-01-17 15:02 混沌战神阿瑞斯 阅读(352) 评论(0) 推荐(0)
摘要:摘要:   1.算法概述   2.算法推导   3.算法特性及优缺点   4.注意事项   5.实现和具体例子 6.适用场合 阅读全文
posted @ 2017-01-16 09:41 混沌战神阿瑞斯 阅读(2498) 评论(0) 推荐(0)
摘要:介绍:以下是李航《统计学习方法的》第一章的部分摘录,只为复习总结用 内容: 1.损失函数: 扩展:线性回归,LR,svm,boosting的损失函数 2.分类器评估方法: 阅读全文
posted @ 2017-01-15 10:51 混沌战神阿瑞斯 阅读(516) 评论(0) 推荐(0)
摘要:摘要:   1.算法概述   2.算法推导   3.算法特性及优缺点   4.注意事项   5.实现和具体例子 6.适用场合 阅读全文
posted @ 2017-01-14 21:59 混沌战神阿瑞斯 阅读(6134) 评论(0) 推荐(0)
摘要:摘要:   1.凸集     1.1 凸集的定义     1.2 仿射集的定义     1.3 凸集的例子     1.4 凸集的保凸运算   2.凸函数     2.1 凸函数的定义     2.2 凸函数的性质     2.3 凸函数的例子     2.4 凸函数的保凸运算   3.凸集和凸函数的等价条件   4.Jensen不等式 阅读全文
posted @ 2017-01-14 21:58 混沌战神阿瑞斯 阅读(1251) 评论(0) 推荐(0)
摘要:摘要:   1.各种算法的推导   2.各种算法的比较(或优缺点)   3.学习理论 4.特征选择方法   5.模型选择方法   6.特征工程   7.数据预处理   8.应用例子 阅读全文
posted @ 2017-01-12 15:59 混沌战神阿瑞斯 阅读(1900) 评论(0) 推荐(1)
摘要:摘要:   1.简介   2.模型   3.策略   4.推导   5.算法    5.1原始问题    5.2对偶问题 阅读全文
posted @ 2017-01-12 10:23 混沌战神阿瑞斯 阅读(502) 评论(0) 推荐(0)
摘要:1.本福特定律   2.商品推荐的惊喜度   3.贝叶斯学派和频率学派   4.指数分布族   5.期望   6.方差   7.协方差   8.皮尔逊相关系数 阅读全文
posted @ 2017-01-08 18:05 混沌战神阿瑞斯 阅读(669) 评论(0) 推荐(1)
摘要:python scikit-learn 环境搭建问题解决记录 阅读全文
posted @ 2017-01-07 23:55 混沌战神阿瑞斯 阅读(360) 评论(0) 推荐(0)
摘要:1.平均值   1.1 全局平均值   1.2 用户评分平均值   1.3 物品评分平均值   1.4 用户分类对物品分类的平均值   分类方法:     1.4.1 平均值分类     1.4.2 活跃度/流行度分类 2.基于邻域的方法   2.1 基于用户的协同过滤   2.2 基于物品的协同过滤   相似度计算方法选择:     基于共现矩阵的相似度     余弦相似度     3.隐语义模型与矩阵分解模型   3.1 ALS 矩阵分解模型   4.加入时间因素   1.基于邻域的模型融合时间信息 5.模型融合   1.级联方式   2.加权融合 阅读全文
posted @ 2017-01-07 23:54 混沌战神阿瑞斯 阅读(901) 评论(0) 推荐(0)
摘要:以上两个join接口都是调用的这个方法: rdd.join的实现:rdd1.join(rdd2) => rdd1.cogroup(rdd2,partitioner) 这是CoGroupedRDD的类声明,其中有两个与java 语法的不同: 1.类型声明中的小于号“<”,这个在scala 中叫做变量类 阅读全文
posted @ 2017-01-07 23:52 混沌战神阿瑞斯 阅读(1742) 评论(0) 推荐(0)
摘要:1.大数定律: 2.中心极限定理 3.参数估计 阅读全文
posted @ 2017-01-07 21:31 混沌战神阿瑞斯 阅读(570) 评论(0) 推荐(0)
摘要:摘要:   1.常见的距离算法     1.1欧几里得距离(Euclidean Distance)以及欧式距离的标准化(Standardized Euclidean distance)     1.2马哈拉诺比斯距离(Mahalanobis Distance)     1.3曼哈顿距离(Manhattan Distance)     1.4切比雪夫距离(Chebyshev Distance)     1.5明可夫斯基距离(Minkowski Distance)     1.6海明距离(Hamming distance)    2.常见的相似度(系数)算法     2.1余弦相似度(Cosine Similarity)以及调整余弦相似度(Adjusted Cosine Similarity)     2.2皮尔森相关系数(Pearson Correlation Coefficient)     2.3Jaccard相似系数(Jaccard Coefficient)     2.4Tanimoto系数(广义Jaccar 阅读全文
posted @ 2017-01-06 16:47 混沌战神阿瑞斯 阅读(50494) 评论(0) 推荐(6)