随笔分类 -  机器学习篇

我的机器学习之路
摘要:本文是对k-means算法整理的一篇学习笔记,参考自吴恩达的机器学习视频,希望对刚起步的小伙伴有帮助 阅读全文
posted @ 2017-12-05 18:48 ML小菜鸟 阅读(12574) 评论(1) 推荐(1) 编辑
摘要:本文结合吴恩达课程,梳理了神经网络中的知识点,适合作为神经网络入门的资料进行学习。 阅读全文
posted @ 2017-11-19 16:20 ML小菜鸟 阅读(12811) 评论(1) 推荐(2) 编辑
摘要:本文介绍了决策树中的特征选择技术(信息增益/信息增益比,基尼系数),然后结合sklearn库介绍了ANOVA和Chi-square用于特征选择的原理和使用。 阅读全文
posted @ 2017-11-13 14:21 ML小菜鸟 阅读(3761) 评论(5) 推荐(1) 编辑
摘要:本文从传统的机器学习工作流程出发,整理了在ML每一步中经常或可能用到的sklearn函数,希望本文可以帮助刚入门的小伙伴快速开始你的sklearn机器学习之旅。 阅读全文
posted @ 2017-11-10 10:54 ML小菜鸟 阅读(158182) 评论(4) 推荐(19) 编辑
摘要:本文介绍了朴素贝叶斯及其涉及到了一些数学方法(这篇写的不怎么好,推荐去看看《统计学习方法》) 阅读全文
posted @ 2017-11-07 16:06 ML小菜鸟 阅读(1829) 评论(0) 推荐(0) 编辑
摘要:本文我们简单介绍了one-hot编码和哑变量编码是如何进行编码过程的,然后又分析了它们各自的特征,最后讨论了它们是如何提升线性模型的非线性能力的。 阅读全文
posted @ 2017-11-06 17:13 ML小菜鸟 阅读(30523) 评论(1) 推荐(11) 编辑
摘要:本文主要主要讨论了softmax的代价函数及其梯度的求解过程,最后给出了之于多分类任务的选型意见 阅读全文
posted @ 2017-11-05 17:33 ML小菜鸟 阅读(8094) 评论(0) 推荐(2) 编辑
摘要:我们介绍了过拟合和欠拟合出现的原因以及解决方案;然后我们对正则化进行了详细的说明,其中重点讨论了L1、L2正则的特性,以及出现该特性的原因 阅读全文
posted @ 2017-11-04 17:04 ML小菜鸟 阅读(1999) 评论(0) 推荐(0) 编辑
摘要:本文简单介绍了文本特征表示的两种常见方法one-hot和TF-IDF,以及对其优缺点进行了分析。 阅读全文
posted @ 2017-10-30 19:58 ML小菜鸟 阅读(56274) 评论(8) 推荐(10) 编辑
摘要:本文由浅到深讲述了LR模型的由来、参数求导过程以及优缺点分析 阅读全文
posted @ 2017-10-21 17:32 ML小菜鸟 阅读(7940) 评论(1) 推荐(2) 编辑
摘要:一元线性回归 我们假设以房屋交易为例,这里我们只有一个自变量(房屋的大小,x),还有一个因变量(房屋的价格,y),那么我们要做的就是根据已知的样本数据(x,y)发现一个规则(也可以称为映射),之后如果有人问你他的房子值多少钱时,你就可以依据他房子的大小根据我们发现的规则很容易的给出他房子的近似价格。 阅读全文
posted @ 2017-10-19 17:09 ML小菜鸟 阅读(1975) 评论(0) 推荐(1) 编辑
摘要:梯度下降是一个用于求解函数最小值的算法。在机器学习问题上,我们通常会得出模型的代价函数,用于评估模型与真实情况之间的差距。通常我们在确定模型时,会将代价函数取最小时的参数值作为我们模型的最终参数。而,在"找出使得代价函数取最小时的参数值"这一重要步骤的求解过程中,我们通常会见到梯度下降大法的身影。梯 阅读全文
posted @ 2017-10-17 12:21 ML小菜鸟 阅读(1097) 评论(0) 推荐(0) 编辑
摘要:最大似然估计法 什么是最大似然 最大似然估计,是一种概率论在统计学中的应用,是参数估计的一种方法。它想要表达的内容是:已知某个随机样本满足某种概率分布,但是其中的参数并不清楚,这时我们要做的就是进行若干次实验,观察其结果,利用结果的情况推出参数的最大可能取值,将该值作为参数的真实值。 举个栗子:有一 阅读全文
posted @ 2017-10-15 14:08 ML小菜鸟 阅读(1252) 评论(0) 推荐(1) 编辑