2017年1月5日

郑捷《机器学习算法原理与编程实践》学习笔记(第四章 推荐系统原理)(二)kmeans

摘要: (上接第二章) 4.3.1 KMeans 算法流程 算法的过程如下: (1)从N个数据文档随机选取K个文档作为质心 (2)对剩余的每个文档测量其到每个质心的距离,并把它归到最近的质心的类 (3)重新计算已经得到的各个类的质心 (4)迭代(2)~(3)步直至新的质心与原质心相等或者小于指定阀值,算法结 阅读全文

posted @ 2017-01-05 17:16 金秀 阅读(1103) 评论(3) 推荐(0) 编辑

郑捷《机器学习算法原理与编程实践》学习笔记(第四章 推荐系统原理)(一)推荐系统概述

摘要: 4.1 推荐系统概述 4.1.1 从亚马逊网站认识推荐系统 4.1.2 推荐系统架构 第一部分 推荐系统至少三个推荐方: 物品信息、用户信息、用户对物品或者信息的偏好 第二部分 算法区域:推荐模型 基于人口统计学的推荐机制、基于内容的推荐、基于协同过滤的推荐(基于项目、基于用户)、基于隐语义的推荐模 阅读全文

posted @ 2017-01-05 15:13 金秀 阅读(341) 评论(0) 推荐(0) 编辑

Python_sklearn机器学习库学习笔记(四)decision_tree(决策树)

摘要: # 决策树 输出结果: [Parallel(n_jobs=-1)]: Done 46 tasks | elapsed: 21.0s [Parallel(n_jobs=-1)]: Done 81 out of 81 | elapsed: 34.7s finished [Parallel(n_jobs= 阅读全文

posted @ 2017-01-05 09:50 金秀 阅读(7320) 评论(0) 推荐(1) 编辑

C++STL学习笔记_(1)vector知识

摘要: #include using namespace std; #include "vector" //数组元素的 添加和删除 void main31() { //获取元素的大小 vector v1; cout 0) { cout v1; v1.push_back(1); v1.push_back(3); v1.push_ba... 阅读全文

posted @ 2017-01-05 09:16 金秀 阅读(163) 评论(0) 推荐(0) 编辑

2017年1月4日

C语言学习笔记(一)_hello world程序中涉及的c语言元素

摘要: 1.1 #include <stdio.h> include是告诉编译器,包含一个头文件。 在C语言当中任何库函数调用都需要提前包含库函数。 1.2 main函数 main函数是C语言的主函数,一个C语言的程序必须有一个主函数,也只能有一个主函数,也只能有一个主函数 1.3 注释 //代表单行注释的 阅读全文

posted @ 2017-01-04 21:43 金秀 阅读(158) 评论(0) 推荐(0) 编辑

郑捷《机器学习算法原理与编程实践》学习笔记(第三章 决策树的发展)(三)_Scikit-learn与回归树

摘要: (上接第三章) 3.4 Scikit-Learn与回归树 3.4.1 回归算法原理 在预测中,CART使用最小剩余方差(squared Residuals Minimization)来判断回归时的最优划分,这个准则期望划分之后的子树与样本点的误差方差最小。这样决策树将数据集切分成很多子模型数据,然后 阅读全文

posted @ 2017-01-04 18:07 金秀 阅读(397) 评论(0) 推荐(0) 编辑

2017年1月3日

郑捷《机器学习算法原理与编程实践》学习笔记(第三章 决策树的发展)(二)_C4.5

摘要: (上接第三章) 3.3.1 信息增益率 信息增益率的定义如下: GainRatio(S,A) = Gain(S,A)/SplitInfo(S,A) 其中Gain(S,A)就是ID3算法中的信息增益,而划分信息SplitInfo(S,A)代表了按照特征A划分样本集S的广度和均匀性。 其中Si到Sc是特 阅读全文

posted @ 2017-01-03 16:41 金秀 阅读(371) 评论(0) 推荐(0) 编辑

郑捷《机器学习算法原理与编程实践》学习笔记(第三章 决策树的发展)(一 )_ID3

摘要: 3.1 决策树的基本思想 3.1.1 从一个实例开始(略) 3.1.2 决策树的算法框架(略) 3.1.3 信息熵测度(略) 3.2 ID3决策树 3.2.1 ID3算法(略) 3.2.2 ID3的实现(Python实现) 定义一个ID3DTree的类来封装算法: (1) 数据导入函数 (2)执行决 阅读全文

posted @ 2017-01-03 15:33 金秀 阅读(823) 评论(0) 推荐(0) 编辑

Python_sklearn机器学习库学习笔记(三)logistic regression(逻辑回归)

摘要: # 逻辑回归 ## 逻辑回归处理二元分类 ## 垃圾邮件分类 输出结果: 预测类型:ham.信息:Waiting in e car 4 my mum lor. U leh? Reach home already?预测类型:ham.信息:Dear got train and seat mine low 阅读全文

posted @ 2017-01-03 10:28 金秀 阅读(76805) 评论(3) 推荐(3) 编辑

2016年12月30日

郑捷《机器学习算法原理与编程实践》学习笔记(第二章 中文文本分类(三)—KNN算法)

摘要: (上接第二章) 2.4 分类算法:KNN 2.4.1 KNN算法原理(略) KNN算法的步骤构成: 第一阶段:确定k值(就是指最近邻居的个数)。一般是一个奇数。因为测试样本有限,故取k值为3. 第二阶段:确定距离度量公式。文本分类一般使用夹角余弦,得出分类数据点和所有已知类别的样本点,从中选择距离最 阅读全文

posted @ 2016-12-30 11:47 金秀 阅读(825) 评论(0) 推荐(1) 编辑

导航