摘要: 所有文章均为原创,转载请注明出处。 阅读全文
posted @ 2017-01-18 23:40 穆晨 阅读(709) 评论(0) 推荐(0) 编辑
摘要: 由于前段时间工作变动,各类琐事缠身,因此暂停了技术博客更新。现已处理完毕,可以腾出时间好好研究数据科学相关理论及开发技术了(^_^)。 阅读全文
posted @ 2018-03-12 09:59 穆晨 阅读(1183) 评论(2) 推荐(2) 编辑
摘要: [推荐系统 - 基础教程]可能是穆晨的所有博文里,最有趣最好玩的一个系列了^ ^。 作为该系列的[入门篇],本文将轻松愉快地向读者介绍推荐系统这项大数据领域中的热门技术。 阅读全文
posted @ 2017-06-12 21:39 穆晨 阅读(6775) 评论(11) 推荐(7) 编辑
摘要: 本文讲解如何使用R语言进行 KMeans 均值聚类分析,并以一个关于人口出生率死亡率的实例演示具体分析步骤。 阅读全文
posted @ 2017-05-20 22:02 穆晨 阅读(4559) 评论(0) 推荐(1) 编辑
摘要: 随机森林非常像《机器学习实践》里面提到过的那个AdaBoost算法,但区别在于它没有迭代,还有就是森林里的树长度不限制。 因为它是没有迭代过程的,不像AdaBoost那样需要迭代,不断更新每个样本以及子分类器的权重。因此模型相对简单点,不容易出现过拟合。 阅读全文
posted @ 2017-05-20 21:36 穆晨 阅读(27560) 评论(0) 推荐(0) 编辑