摘要: 机器学习算法完整版见fenghaootong-githubSVMLinear Support Vector MachineDual Support Vector MachineKernel Support Vector MachineSoft-Margin ... 阅读全文
posted @ 2018-03-07 15:51 一小白 阅读(360) 评论(0) 推荐(0) 编辑
摘要: 机器学习算法完整版见fenghaootong-githubMINST for SVM导入模块 from sklearn import svmimport pandas as pdimport time导入数据 df = pd.read_csv('../DAT... 阅读全文
posted @ 2018-03-07 15:48 一小白 阅读(411) 评论(0) 推荐(0) 编辑
摘要: 机器学习算法完整版见fenghaootong-github随机森林(Random Forests)鉴于决策树容易过拟合的缺点,随机森林采用多个决策树的投票机制来改善决策树 我们假设随机森林使用了m棵决策树,那么就需要产生m个一定数量的样本集来训练每一棵树,如... 阅读全文
posted @ 2018-03-07 15:44 一小白 阅读(203) 评论(0) 推荐(0) 编辑
摘要: 机器学习算法完整版见fenghaootong-githubTitanic预测哪些乘客会幸存下来数据集数据特征: Survived:是否存活(0代表否,1代表是) Pclass:社会阶级(1代表上层阶级,2代表中层阶级,3代表底层阶级)Name:船上乘客的名... 阅读全文
posted @ 2018-03-07 15:40 一小白 阅读(504) 评论(0) 推荐(0) 编辑
摘要: 机器学习算法完整版见fenghaootong-github决策树(Decision Trees)构建决策树三个步骤:特征选择决策数生成决策数剪枝特征选择熵(entropy) 熵是表示随机变量不确定性的度量。设X是一个取有限个值的离散随机变量,其概率分布为P... 阅读全文
posted @ 2018-03-07 15:14 一小白 阅读(394) 评论(0) 推荐(0) 编辑
摘要: 机器学习算法完整版见fenghaootong-githubTitanic预测哪些乘客会幸存下来数据集数据特征: Survived:是否存活(0代表否,1代表是) Pclass:社会阶级(1代表上层阶级,2代表中层阶级,3代表底层阶级)Name:船上乘客的名... 阅读全文
posted @ 2018-03-07 15:11 一小白 阅读(530) 评论(0) 推荐(0) 编辑
摘要: 机器学习算法完整版见fenghaootong-github 贝叶斯(Bayesian Techniques)朴素贝叶斯高斯贝叶斯分类器多项式贝叶斯分类器伯努利贝叶斯分类器贝叶斯定理:P(Bi|A)=P(A|Bi)P(B)∑j=1nP(A|B... 阅读全文
posted @ 2018-03-07 14:44 一小白 阅读(253) 评论(0) 推荐(0) 编辑
摘要: 机器学习算法完整版见fenghaootong-github 垃圾邮件分类在DATA/email/spam文件夹中有25封垃圾邮件,在DATA/email/ham中有25封正常邮件,将其进行垃圾邮件分类。导入需要的库 from numpy import *... 阅读全文
posted @ 2018-03-07 14:43 一小白 阅读(189) 评论(0) 推荐(0) 编辑
摘要: 机器学习算法完整版见fenghaootong-github 贝叶斯解决手写体数据集描述数据文件train.csv和test.csv包含从零到九的手绘数字的灰度图像。每个图像是高28个像素,宽28个像素,总共784像素,每个像素都有一个与之相关的像素值,用... 阅读全文
posted @ 2018-03-07 14:36 一小白 阅读(335) 评论(0) 推荐(0) 编辑
摘要: 机器学习算法完整版见fenghaootong-github 房价预测数据集描述数据共有81个特征 SalePrice - the property’s sale price in dollars. This is the target variabl... 阅读全文
posted @ 2018-03-07 14:23 一小白 阅读(1201) 评论(0) 推荐(0) 编辑
摘要: 机器学习算法完整版见fenghaootong-github 逻辑回归(Logistic Regression)Regression问题的常规步骤为: 寻找h函数(即hypothesis);构造J函数(损失函数);想办法使得J函数最小并求得回归参数(θ... 阅读全文
posted @ 2018-03-07 14:21 一小白 阅读(165) 评论(0) 推荐(0) 编辑
摘要: 机器学习算法完整版见fenghaootong-github DataExplorationWe know the data is very important in data science,but it is time-consuming.impor... 阅读全文
posted @ 2018-03-07 14:20 一小白 阅读(155) 评论(0) 推荐(0) 编辑
摘要: 机器学习算法完整版见fenghaootong-github MINST for KNN数据集描述数据文件train.csv和test.csv包含从零到九的手绘数字的灰度图像。每个图像是高28个像素,宽28个像素,总共784像素,每个像素都有一个与之相关... 阅读全文
posted @ 2018-03-07 14:18 一小白 阅读(817) 评论(0) 推荐(0) 编辑
摘要: 机器学习算法完整版见fenghaootong-github KNN算法kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个... 阅读全文
posted @ 2018-03-07 14:17 一小白 阅读(185) 评论(0) 推荐(0) 编辑