随笔分类 -  机器学习(转载)

该文被密码保护。
posted @ 2015-09-05 18:28 菜鸡一枚 阅读(0) 评论(0) 推荐(0) 编辑
摘要:Which Algorithm Family Can Answer My Question?This post, authored by Brandon Rohrer, Senior Data Scientist at Microsoft, is the last in a three-part s... 阅读全文
posted @ 2015-09-02 19:10 菜鸡一枚 阅读(246) 评论(0) 推荐(0) 编辑
摘要:模型选择的一些基本思想和方法0. 引言有监督学习是日常使用最多的建模范式,它有许多更具体的名字,比如预测模型、回归模型、分类模型或者分类器。这些名字或来源统计,或来源于机器学习。关于统计学习与机器学习的区别已经有不少讨论,不少人认为机器学习侧重于目标预测,而统计学习侧重于机制理解和建模。个人更加直观... 阅读全文
posted @ 2015-08-31 18:39 菜鸡一枚 阅读(1747) 评论(0) 推荐(0) 编辑
摘要:A Gentle Guide to Machine LearningMachine Learning is a subfield within Artificial Intelligence that builds algorithms that allow computers to learn t... 阅读全文
posted @ 2015-08-30 20:48 菜鸡一枚 阅读(246) 评论(0) 推荐(0) 编辑
摘要:EM算法(Expectation Maximization Algorithm)1. 前言 这是本人写的第一篇博客(2013年4月5日发在cnblogs上,现在迁移过来),是学习李航老师的《统计学习方法》书以及斯坦福机器学习课Andrew Ng的EM算法课后,对EM算法学习的介绍性笔记,如有写得不... 阅读全文
posted @ 2015-08-29 20:54 菜鸡一枚 阅读(399) 评论(0) 推荐(0) 编辑
摘要:混合高斯模型(Mixtures of Gaussians)和EM算法这篇讨论使用期望最大化算法(Expectation-Maximization)来进行密度估计(density estimation)。 与k-means一样,给定的训练样本是,我们将隐含类别标签用表示。与k-means的硬指定不同,... 阅读全文
posted @ 2015-08-29 20:51 菜鸡一枚 阅读(851) 评论(0) 推荐(0) 编辑
摘要:【机器学习】EM算法详细推导和讲解 今天不太想学习,炒个冷饭,讲讲机器学习十大算法里有名的EM算法,文章里面有些个人理解,如有错漏,还请读者不吝赐教。 众所周知,极大似然估计是一种应用很广泛的参数估计方法。例如我手头有一些东北人的身高的数据,又知道身高的概率模型是高斯分布,那么利用极大化似然函数的... 阅读全文
posted @ 2015-08-29 20:38 菜鸡一枚 阅读(7529) 评论(0) 推荐(1) 编辑
摘要:EM算法本文试图用最简单的例子、最浅显的方式说明EM(Expectation Maximization)算法的应用场景和使用方法,而略去公式的推导和收敛性的证明。以下内容翻译自《Data-Intensive Text Processingwith MapReduce》。Maximum Likelih... 阅读全文
posted @ 2015-08-29 20:33 菜鸡一枚 阅读(594) 评论(0) 推荐(0) 编辑
摘要:5 Techniques To Understand Machine Learning Algorithms Without the Background in MathematicsWhere does theory fit into a top-down approach to studying... 阅读全文
posted @ 2015-08-24 19:27 菜鸡一枚 阅读(292) 评论(0) 推荐(0) 编辑
该文被密码保护。
posted @ 2015-08-21 14:11 菜鸡一枚 阅读(0) 评论(0) 推荐(0) 编辑
该文被密码保护。
posted @ 2015-08-18 20:29 菜鸡一枚 阅读(0) 评论(0) 推荐(0) 编辑
摘要:聚类分析初探第一章 引言第二章 预备知识第三章 直接聚类法第四章 K-means第五章 DBSCAN第六章 OPTICS第七章聚类分析的效果评测第八章数据尺度化问题发表在 Science 上的一种新聚类算法 本文摘自中国科学院计算技术研究所周昭涛的硕士论文《文本聚类分析效果评价及文本表示研究》的... 阅读全文
posted @ 2015-08-16 12:01 菜鸡一枚 阅读(828) 评论(0) 推荐(0) 编辑
摘要:一小时了解数据挖掘⑤数据挖掘步骤&常用的聚类、决策树和CRISP-DM概念接前面系列4篇:一小时了解数据挖掘①:解析常见的大数据应用案例一小时了解数据挖掘②:分类算法的应用和成熟案例解析一小时了解数据挖掘③:详解大数据挖掘の分类技术一小时了解数据挖掘④:商务智能原理解读の数据挖掘九大定律数据挖掘有很... 阅读全文
posted @ 2015-08-16 11:39 菜鸡一枚 阅读(1161) 评论(0) 推荐(0) 编辑
摘要:7 Types of Regression Techniques you should know!IntroductionLinear and Logistic regressions are usually the first algorithms people learn in predicti... 阅读全文
posted @ 2015-08-14 19:52 菜鸡一枚 阅读(494) 评论(0) 推荐(0) 编辑
摘要:各种聚类算法的比较 聚类的目标是使同一类对象的相似度尽可能地大;不同类对象之间的相似度尽可能地小。目前聚类的方法很多,根据基本思想的不同,大致可以将聚类算法分为五大类:层次聚类算法、分割聚类算法、基于约束的聚类算法、机器学习中的聚类算法和用于高维度的聚类算法。摘自 数据挖掘中的聚类分析研究综述 这篇... 阅读全文
posted @ 2015-08-14 17:55 菜鸡一枚 阅读(3955) 评论(0) 推荐(1) 编辑
该文被密码保护。
posted @ 2015-08-13 14:47 菜鸡一枚 阅读(0) 评论(0) 推荐(0) 编辑
摘要:Feature Engineering versus Feature Extraction: Game On!"Feature engineering" is a fancy term for making sure that your predictors are encoded in the m... 阅读全文
posted @ 2015-08-04 20:03 菜鸡一枚 阅读(464) 评论(0) 推荐(0) 编辑
摘要:Cross Validation done wrongCross validation is an essential tool in statistical learning1to estimate the accuracy of your algorithm. Despite its great... 阅读全文
posted @ 2015-07-30 19:32 菜鸡一枚 阅读(450) 评论(0) 推荐(0) 编辑
摘要:The Brain as a Universal Learning MachineThis article presents an emerging architectural hypothesis of the brain as a biological implementation of aUn... 阅读全文
posted @ 2015-07-29 20:34 菜鸡一枚 阅读(278) 评论(0) 推荐(0) 编辑
摘要:各大公司广泛使用的在线学习算法FTRL详解现在做在线学习和CTR常常会用到逻辑回归(Logistic Regression),而传统的批量(batch)算法无法有效地处理超大规模的数据集和在线数据流,google先后三年时间(2010年-2013年)从理论研究到实际工程化实现的FTRL(Follow... 阅读全文
posted @ 2015-07-29 19:55 菜鸡一枚 阅读(795) 评论(0) 推荐(0) 编辑