摘要: 机器学习问题方法总结大类名称关键词有监督分类决策树信息增益分类回归树Gini指数,Χ2统计量,剪枝朴素贝叶斯非参数估计,贝叶斯估计线性判别分析Fishre判别,特征向量求解K最邻近相似度度量:欧氏距离、街区距离、编辑距离、向量夹角、Pearson相关系数逻辑斯谛回归(二值分类)参数估计(极大似然估计... 阅读全文
posted @ 2014-11-27 11:41 大雄的哆啦A梦 阅读(248) 评论(0) 推荐(0) 编辑
摘要: 本文就高斯混合模型(GMM,Gaussian Mixture Model)参数如何确立这个问题,详细讲解期望最大化(EM,Expectation Maximization)算法的实施过程。单高斯分布模型GSM多维变量X服从高斯分布时,它的概率密度函数PDF为:x是维度为d的列向量,u是模型期望,Σ是... 阅读全文
posted @ 2014-11-27 11:34 大雄的哆啦A梦 阅读(337) 评论(0) 推荐(0) 编辑
摘要: 目前机器学习最热门的领域有以下七个,后面给出相应的资料链接:1. 迁移学习Transfer learning 。 http://www.cse.ust.hk/TL/index.html2. 半监督学习Semi-Supervised learning 。 http://pages.cs.wisc.ed... 阅读全文
posted @ 2014-11-27 11:15 大雄的哆啦A梦 阅读(405) 评论(0) 推荐(0) 编辑
摘要: EM是我一直想深入学习的算法之一,第一次听说是在NLP课中的HMM那一节,为了解决HMM的参数估计问题,使用了EM算法。在之后的MT中的词对齐中也用到了。在Mitchell的书中也提到EM可以用于贝叶斯网络中。下面主要介绍EM的整个推导过程。1. Jensen不等式 回顾优化理论中的一些概念。设f是... 阅读全文
posted @ 2014-11-27 10:55 大雄的哆啦A梦 阅读(248) 评论(0) 推荐(0) 编辑