君子博学而日参省乎己 则知明而行无过矣

博客园 首页 新随笔 联系 订阅 管理

2015年7月22日 #

摘要: 动机在机器学习领域中,我们常常会遇到维数很高的数据,有些数据的特征维度高达上百万维,很显然这样的数据是无法直接计算的,而且维度这么高,其中包含的信息一定有冗余,这时就需要进行降维,总的来说,我们降维的主要目的有如下几条:在原始的高维空间中,包含有冗余信息以及噪音信息,在实际应用例如图像识别中造成了误... 阅读全文
posted @ 2015-07-22 01:37 刺猬的温驯 阅读(508) 评论(0) 推荐(0) 编辑

摘要: 什么是决策树其实网络上有着很多说明决策树的文章,比如参考资料中的1和2,主要是因为这个机器学习的方法实在太经典了,有着很多不同的算法实现,包括最早的由Quinlan在1986年提出的ID3算法、1993年同样是Quinlan提出的C4.5算法以及由Braiman等人在1984年提出的CART算法。尽... 阅读全文
posted @ 2015-07-22 01:35 刺猬的温驯 阅读(381) 评论(0) 推荐(0) 编辑

摘要: 朴素贝叶斯在经典的分类器模型中,Naive Bayes Classifier应该是比较简单的一种了,比之前的决策树要简单得多,但是它虽然简单,但是一点都不简约,在很多情况下它往往能得到比较好的分类效果。通常的分类问题中,每一个实例都可以用一个特征向量来表示的,其相应的类别用来表示,且,。其中表示样本... 阅读全文
posted @ 2015-07-22 01:34 刺猬的温驯 阅读(399) 评论(0) 推荐(0) 编辑

摘要: 作为应用广泛的一种统计模型(尤其是在自然语言处理(NLP)中),隐马尔科夫模型是非常值得一说的,本文就隐马尔科夫模型的原理和应用介绍进行说明。由于隐马尔科夫模型有着很多不同的具体算法实现,本文暂时跳过这部分内容,算法部分会另外写成一篇博文。马尔科夫链在语言模型及其实现中,我曾经简单地提到过马尔科夫链... 阅读全文
posted @ 2015-07-22 01:29 刺猬的温驯 阅读(827) 评论(0) 推荐(0) 编辑

摘要: 感知机(perceptron)是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值。感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面,属于判别模型。感知机旨在求出将训练数据进行线性划分的分离超平面。为此,导入基于误分类的损失函数,利用梯度下降法对损失... 阅读全文
posted @ 2015-07-22 01:27 刺猬的温驯 阅读(1842) 评论(0) 推荐(0) 编辑

摘要: Logistic回归在实际应用中,除了预测问题,其实更多的是 分类问题,回归问题和分类问题其实是非常相似的,主要区别是分类问题的输出变量Y是取有限个离散值的,而回归问题本质上是一个拟合问题,给定一组已知数据,选择一条函数曲线使其很好地拟合已知数据且很好地预测未知数据。面对两个相似的问题,我们就要考虑... 阅读全文
posted @ 2015-07-22 01:24 刺猬的温驯 阅读(264) 评论(0) 推荐(0) 编辑

摘要: 最小二乘法简介最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。上面的定义是摘自维基百科,在实际拟合应用中,而我个人直观的理解就是,最小二乘法是一个评价函数(标... 阅读全文
posted @ 2015-07-22 01:22 刺猬的温驯 阅读(852) 评论(0) 推荐(0) 编辑

摘要: 前言最近在看斯坦福的《机器学习》的公开课,这个课程是2009年的,有点老了,不过讲的还是很好的,廓清了一些我以前关于机器学习懵懂的地方。我的一位老师曾经说过:什么叫理解?理解就是你能把同一个事情用自己的语言表达出来,并且能让别人听得懂。本着这样的原则,同时也为了证明自己是”理解”的,于是决定打算在学... 阅读全文
posted @ 2015-07-22 01:17 刺猬的温驯 阅读(287) 评论(0) 推荐(0) 编辑