随笔分类 - algorithm
算法小结
摘要:
唐宇迪的《跟着迪哥学:Python数据分析与机器学习实战》,2019年9月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第5章-回归算法,本章主要介绍线性回归与逻辑回归算法,分别对应回归与分类问题,并结合梯度下降优化思想进行参数求解。
阅读全文

摘要:
唐宇迪的《跟着迪哥学:Python数据分析与机器学习实战》,2019年9月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第16章聚类算法。分类和回归算法在推导过程中都需要数据标签,也就是有监督问题。那么,如果数据本身没有标签,如何把它们按堆进行划分呢?这时候聚类算法就派上用场了,本章选择聚类算法K-means与DBSCAN进行原理讲解与实例演示。
阅读全文

摘要:
唐宇迪的《跟着迪哥学:Python数据分析与机器学习实战》,2019年9月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第15章降维算法。如果拿到的数据特征过于庞大,一方面会使得计算任务变得繁重;另一方面,如果数据特征还有问题,可能会对结果造成不利的影响。降维是机器学习领域中经常使用的数据处理方法,一般通过某种映射方法,将原始高维空间中的数据点映射到低维度的空间中,本章将从原理和实践的角度介绍两种经典的降维算法——线性判别分析和主成分分析。
阅读全文

摘要:
唐宇迪的《跟着迪哥学:Python数据分析与机器学习实战》,2019年9月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第19章-卷积神经网络。本章介绍现阶段神经网络中非常火的模型——卷积神经网络,它在计算机视觉中有着非常不错的效果。
阅读全文

摘要:
唐宇迪的《跟着迪哥学:Python数据分析与机器学习实战》,2019年9月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第10章-特征工程。特征工程其实就是要从原始数据中找到最有价值的信息,并转换成计算机所能读懂的形式。本章结合数值数据与文本数据来分别阐述如何进行数值特征与文本特征的提取。
阅读全文

摘要:
唐宇迪的《跟着迪哥学:Python数据分析与机器学习实战》,2019年9月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第17章-神经网络,本章内容主要包括神经网络各模块工作细节、整体网络模型架构、过拟合解决方法。
阅读全文

摘要:
唐宇迪的《跟着迪哥学:Python数据分析与机器学习实战》,2019年9月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第13章-推荐系统,本章向大家介绍推荐系统中的常用算法。
阅读全文

摘要:
唐宇迪的《跟着迪哥学:Python数据分析与机器学习实战》,2019年9月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第8章集成学习(ensemble learning)是目前非常流行的机器学习策略,基本上所有问题都可以借用其思想来得到效果上的提升。集成学习既可以用于分类问题,也可以用于回归问题,在机器学习领域会经常看到它的身影,本章就来探讨一下几种经典的集成策略,并结合其应用进行通俗解读。
阅读全文

摘要:
唐宇迪的《跟着迪哥学:Python数据分析与机器学习实战》,2019年9月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第7章-决策树,本章介绍树模型的构造方法以及其中涉及的剪枝策略。
阅读全文

摘要:
唐宇迪的《跟着迪哥学:Python数据分析与机器学习实战》,2019年9月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。第11章--贝叶斯算法项目实战 ——新闻分类。 本章结合贝叶斯算法通过新闻数据集的分类任务来探索其中每一步实现细节。
阅读全文

摘要:
唐宇迪的《跟着迪哥学:Python数据分析与机器学习实战》,2019年9月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第18章TensorFlow实战,本章从实战的角度介绍Numpy工具包的核心模块与常用函数的使用方法。
阅读全文

摘要:
唐宇迪的《跟着迪哥学:Python数据分析与机器学习实战》,2019年9月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第9章-随机森林项目实战——气温预测。本章将从实战的角度出发,借助Python工具包完成气温预测任务,其中涉及多个模块,主要包含随机森林建模、特征选择、效率对比、参数调优等。这个实例过长,分为2篇,这是第2篇。
阅读全文

摘要:
唐宇迪的《跟着迪哥学:Python数据分析与机器学习实战》,2019年9月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第6章-逻辑回归项目实战——信用卡欺诈检测。
阅读全文

摘要:
阿曼多·凡丹戈(Armando Fandango)的《python数据分析(第2版)》,2018年6月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。第10章“预测性分析与机器学习”通过一个例子来说明人工智能在天气预报上的应用,这主要借助于scikit-learn。不过,有些机器学习算法在scikit-learn中尚未实现,所以有时还要求助其他API。
阅读全文

摘要:
阿曼多·凡丹戈(Armando Fandango)的《python数据分析(第2版)》,2018年6月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。第6章“数据可视化”介绍如何利用Matplotlib和Pandas的绘图函数来实现数据的可视化。
阅读全文

摘要:
阿曼多·凡丹戈(Armando Fandango)的《python数据分析(第2版)》,2018年6月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。第4章“统计学与线性代数”对线性代数和统计函数做了简要回顾。
阅读全文

摘要:
托马兹·卓巴斯的《数据分析实战》,2018年6月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第10章解释了选择模型理论以及一些流行的模型:多项式Logit模型、嵌套Logit模型以及混合Logit模型。
阅读全文

摘要:
托马兹·卓巴斯的《数据分析实战》,2018年6月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第9章描述了多种与分析文本信息流相关的技巧:词性标注、主题抽取以及对文本数据的分类。
阅读全文

摘要:
托马兹·卓巴斯的《数据分析实战》,2018年6月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第7章探索了如何处理和理解时间序列数据,并建立ARMA模型以及ARIMA模型。
阅读全文

摘要:
托马兹·卓巴斯的《数据分析实战》,2018年6月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第6章涵盖了许多回归模型,有线性的,也有非线性的。我们还会复习随机森林和支持向量机,它们可用来解决分类或回归问题。
阅读全文
