摘要:
本文是对k-means算法整理的一篇学习笔记,参考自吴恩达的机器学习视频,希望对刚起步的小伙伴有帮助 阅读全文
摘要:
本文结合吴恩达课程,梳理了神经网络中的知识点,适合作为神经网络入门的资料进行学习。 阅读全文
摘要:
本文介绍了决策树中的特征选择技术(信息增益/信息增益比,基尼系数),然后结合sklearn库介绍了ANOVA和Chi-square用于特征选择的原理和使用。 阅读全文
摘要:
本文描述了 正则模块re、参数解析模块argparse、分词工具jieba 的一些简单使用方法。(未完待补充) 阅读全文
摘要:
本文从传统的机器学习工作流程出发,整理了在ML每一步中经常或可能用到的sklearn函数,希望本文可以帮助刚入门的小伙伴快速开始你的sklearn机器学习之旅。 阅读全文
摘要:
本文介绍了朴素贝叶斯及其涉及到了一些数学方法(这篇写的不怎么好,推荐去看看《统计学习方法》) 阅读全文
摘要:
本文我们简单介绍了one-hot编码和哑变量编码是如何进行编码过程的,然后又分析了它们各自的特征,最后讨论了它们是如何提升线性模型的非线性能力的。 阅读全文
摘要:
本文主要主要讨论了softmax的代价函数及其梯度的求解过程,最后给出了之于多分类任务的选型意见 阅读全文
摘要:
我们介绍了过拟合和欠拟合出现的原因以及解决方案;然后我们对正则化进行了详细的说明,其中重点讨论了L1、L2正则的特性,以及出现该特性的原因 阅读全文
摘要:
本文简单介绍了文本特征表示的两种常见方法one-hot和TF-IDF,以及对其优缺点进行了分析。 阅读全文