futurehau

导航

 

2016年12月7日

摘要: 一、Linear Support Vector Machine 接下来的讨论假设数据都是线性可分的。 1.1 SVM的引入:增大对测量误差的容忍度 假设有训练数据和分类曲线如下图所示: 很明显,三个分类器都能够正确分类训练数据,但是哪一个的效果更好呢?直觉告诉我们第三个,为什么呢? 这是因为第三个的 阅读全文
posted @ 2016-12-07 23:01 futurehau 阅读(1987) 评论(0) 推荐(0) 编辑
 

2016年12月6日

只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2016-12-06 09:20 futurehau 阅读(89) 评论(0) 推荐(0) 编辑
 

2016年12月2日

摘要: plt 离散点图 subplot: '-'就会拟合 1 import matplotlib.pyplot as plt 2 3 plt.plot(data['TV'], y, 'ro', label='TV') 4 plt.plot(data['Radio'], y, 'g^', label='Ra 阅读全文
posted @ 2016-12-02 17:46 futurehau 阅读(362) 评论(0) 推荐(0) 编辑
 
摘要: anaconda 中安装sklearn : conda install scikit-learn 查看安装的软件包及版本信息:pip list 或者 conda list 安装pip: 安装setup-tools pip install numpy老出现问题: 终于找到原因了。原因在于云主机1G内存 阅读全文
posted @ 2016-12-02 17:31 futurehau 阅读(166) 评论(0) 推荐(0) 编辑
 

2016年11月30日

摘要: 为了准备实习面试,今天重新看了一下决策树与随机森林,用面试者的口吻总结一下。 决策树可以用于解决分类问题也可以用于解决回归问题,主要思想就是递归的建立一棵树。 与LR和SVM相比,决策树的决策边界是不平滑的。决策树是一种贪婪算法。 决策树的生成过程: 分类问题可以基于信息增益最大准则,每次选择信息增 阅读全文
posted @ 2016-11-30 15:27 futurehau 阅读(641) 评论(0) 推荐(0) 编辑
 

2016年11月28日

摘要: 读取文件Advertising.csv,文件内容类似于: 1 ,TV,Radio,Newspaper,Sales 2 1,230.1,37.8,69.2,22.1 3 2,44.5,39.3,45.1,10.4 4 3,17.2,45.9,69.3,9.3 5 4,151.5,41.3,58.5,1 阅读全文
posted @ 2016-11-28 16:10 futurehau 阅读(353) 评论(0) 推荐(0) 编辑
 
摘要: 1. 准确率 评价分类问题的性能的指标一般是分类准确率,其定义是对于给定的数据,分类正确的样本数占总样本数的比例。但是这一指标在Unbalanced的数据上表现很差。比如说我的样本有990个正样本,10个负样本,我直接把所有样本都预测为正,我的准确率为99%,居然有这么高得准确率,但我的分类方法实际 阅读全文
posted @ 2016-11-28 15:38 futurehau 阅读(20620) 评论(0) 推荐(1) 编辑
 

2016年11月27日

摘要: Logistic回归是目前最常用的一种分类算法。之前讨论了线性回归 http://www.cnblogs.com/futurehau/p/6105011.html,采用线性回归是不能解决或者说不能很好解决分类问题的,很直观的一个解释如下图所示,这里介绍Logistic回归。 一、Logistic 回 阅读全文
posted @ 2016-11-27 19:52 futurehau 阅读(1532) 评论(0) 推荐(0) 编辑
 

2016年11月26日

摘要: 1、向量、矩阵求导 当然了,这里补充一下求解过程中的关于向量、矩阵求导的几个公式: 这里其实只需要明白第一个,后边的三个都可以由第一个简单的推导而来。 注意这里对列向量AX的每一项的求导写为行,不然就会得到一个超越矩阵,我们不采用这种方式。 阅读全文
posted @ 2016-11-26 21:03 futurehau 阅读(3259) 评论(0) 推荐(1) 编辑
 
摘要: 一、回归问题的定义 回归是监督学习的一个重要问题,回归用于预测输入变量和输出变量之间的关系。回归模型是表示输入变量到输出变量之间映射的函数。回归问题的学习等价于函数拟合:使用一条函数曲线使其很好的拟合已知函数且很好的预测未知数据。 回归问题分为模型的学习和预测两个过程。基于给定的训练数据集构建一个模 阅读全文
posted @ 2016-11-26 19:28 futurehau 阅读(24735) 评论(0) 推荐(1) 编辑