01 2017 档案
摘要:摘要:
1.正则化(Regularization)
1.1 正则化的目的
1.2 正则化的L1范数(lasso),L2范数(ridge),ElasticNet
2.归一化 (Normalization)
2.1归一化的目的
2.1归一化计算方法
2.2.spark ml中的归一化
2.3 python中skelearn中的归一化
阅读全文
摘要:摘要:
1.各个数据结构的应用举例
1.1 String类型应用举例
1.2List类型应用举例
1.3Set类型应用举例
1.4Sorted Set类型应用举例
1.5Hash类型应用举例
阅读全文
摘要:摘要:
1.算法概述
2.算法推导
3.算法特性及优缺点
4.注意事项
5.实现和具体例子
6.适用场合
阅读全文
摘要:介绍:以下是李航《统计学习方法的》第一章的部分摘录,只为复习总结用 内容: 1.损失函数: 扩展:线性回归,LR,svm,boosting的损失函数 2.分类器评估方法:
阅读全文
摘要:摘要:
1.算法概述
2.算法推导
3.算法特性及优缺点
4.注意事项
5.实现和具体例子
6.适用场合
阅读全文
摘要:摘要:
1.凸集
1.1 凸集的定义
1.2 仿射集的定义
1.3 凸集的例子
1.4 凸集的保凸运算
2.凸函数
2.1 凸函数的定义
2.2 凸函数的性质
2.3 凸函数的例子
2.4 凸函数的保凸运算
3.凸集和凸函数的等价条件
4.Jensen不等式
阅读全文
摘要:摘要:
1.各种算法的推导
2.各种算法的比较(或优缺点)
3.学习理论
4.特征选择方法
5.模型选择方法
6.特征工程
7.数据预处理
8.应用例子
阅读全文
摘要:摘要:
1.简介
2.模型
3.策略
4.推导
5.算法
5.1原始问题
5.2对偶问题
阅读全文
摘要:1.本福特定律
2.商品推荐的惊喜度
3.贝叶斯学派和频率学派
4.指数分布族
5.期望
6.方差
7.协方差
8.皮尔逊相关系数
阅读全文
摘要:python scikit-learn 环境搭建问题解决记录
阅读全文
摘要:1.平均值
1.1 全局平均值
1.2 用户评分平均值
1.3 物品评分平均值
1.4 用户分类对物品分类的平均值
分类方法:
1.4.1 平均值分类
1.4.2 活跃度/流行度分类
2.基于邻域的方法
2.1 基于用户的协同过滤
2.2 基于物品的协同过滤
相似度计算方法选择:
基于共现矩阵的相似度
余弦相似度
3.隐语义模型与矩阵分解模型
3.1 ALS 矩阵分解模型
4.加入时间因素
1.基于邻域的模型融合时间信息
5.模型融合
1.级联方式
2.加权融合
阅读全文
摘要:以上两个join接口都是调用的这个方法: rdd.join的实现:rdd1.join(rdd2) => rdd1.cogroup(rdd2,partitioner) 这是CoGroupedRDD的类声明,其中有两个与java 语法的不同: 1.类型声明中的小于号“<”,这个在scala 中叫做变量类
阅读全文
摘要:摘要:
1.常见的距离算法
1.1欧几里得距离(Euclidean Distance)以及欧式距离的标准化(Standardized Euclidean distance)
1.2马哈拉诺比斯距离(Mahalanobis Distance)
1.3曼哈顿距离(Manhattan Distance)
1.4切比雪夫距离(Chebyshev Distance)
1.5明可夫斯基距离(Minkowski Distance)
1.6海明距离(Hamming distance)
2.常见的相似度(系数)算法
2.1余弦相似度(Cosine Similarity)以及调整余弦相似度(Adjusted Cosine Similarity)
2.2皮尔森相关系数(Pearson Correlation Coefficient)
2.3Jaccard相似系数(Jaccard Coefficient)
2.4Tanimoto系数(广义Jaccar
阅读全文

浙公网安备 33010602011771号