摘要:【火炉炼AI】机器学习054 用ICA做盲源分离 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 盲源分离是指在信号的理论模型和源信号无法精确获知的情况下,如何从混叠信号中分离出各源信号的
阅读全文
摘要:【火炉炼AI】机器学习053 数据降维绝招 PCA和核PCA (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 主成分分析(Principal Component Analysis, PCA
阅读全文
摘要:【火炉炼AI】机器学习052 OpenCV构建人脸鼻子眼睛检测器 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2,opencv python 3.4.2) 有两个重要的概念需要澄清一下:人脸检
阅读全文
摘要:【火炉炼AI】机器学习051 视觉词袋模型+极端随机森林建立图像分类器 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 视觉词袋模型(Bag Of Visual Words,BOVW)来源
阅读全文
摘要:【火炉炼AI】机器学习050 提取图像的Star特征 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 对于图像的特征点,前面我们讨论过边缘检测方法,Harris角点检测算法等,这些检测算法
阅读全文
摘要:【火炉炼AI】机器学习049 提取图像的SIFT特征点 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 图像中的特征点,就是某一幅图像区别于其他图像的关键点位,在进行这些关键点位的检测时,
阅读全文
摘要:【火炉炼AI】机器学习048 Harris检测图像角点 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 角点检测算法大致有三类:基于灰度图像的角点检测,基于二值图像的角点检测,基于轮廓曲线
阅读全文
摘要:【火炉炼AI】机器学习047 图像的直方图均衡化操作 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 图像的直方图是指图像中每一像素范围内像素频率的统计关系图,直方图能够给出图像灰度范围,
阅读全文
摘要:【火炉炼AI】机器学习046 图像边缘的检测方法 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 图像中各种形状的检测时计算机视觉领域中非常常见的技术之一,特别是图像中直线的检测,圆的检测
阅读全文
摘要:【火炉炼AI】机器学习045 对股票数据进行隐马尔科夫建模 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 股票数据是非常非常典型的时序数据,数据都是按照日期排列好,而且股价就是我们所能观
阅读全文
摘要:【火炉炼AI】机器学习044 创建隐马尔科夫模型 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 隐马尔科夫模型(Hidden Markov Model, HMM)是非常经典的机器学习模型
阅读全文
摘要:【火炉炼AI】机器学习043 pandas操作时间序列数据 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 时间序列数据分析是机器学习领域中的一个重要领域,时间序列数据是随着时间变化而不断
阅读全文
摘要:【火炉炼AI】机器学习042 NLP文本的主题建模 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2, NLTK 3.3) 文本的主题建模时用NLP来识别文本文档中隐藏的某种模式的过程,可以发现
阅读全文
摘要:【火炉炼AI】机器学习041 NLP句子情感分析 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 在NLP中有一个非常实用的应用领域 情感分析,情感分析是用NLP技术分析一段给定文本的情感
阅读全文
摘要:【火炉炼AI】机器学习040 NLP性别判断分类器 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2, NLTK 3.3) 本文的目标是构建一个分类器,从名字就判断这个人是男性还是女性。能够建立
阅读全文
摘要:【火炉炼AI】机器学习039 NLP文本分类器 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2, NLTK 3.3) 前面我们学习了很多用NLP进行文本的分词,文本分块,创建词袋模型等,这些步
阅读全文
摘要:【火炉炼AI】机器学习038 NLP创建词袋模型 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2, NLTK 3.3) 词袋模型(Bag Of Words, BOW)和词向量(Word Emb
阅读全文
摘要:【火炉炼AI】机器学习037 NLP文本分块 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2, NLTK 3.3) 文本分块是将一大段文本分割成几段小文本,其目的是比如想获取一段文本中的一小部
阅读全文
摘要:【火炉炼AI】机器学习036 NLP词形还原 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2, NLTK 3.3) 词形还原也是将单词转换为原来的相貌,和上一篇文章中介绍的词干提取不一样,词形
阅读全文
摘要:【火炉炼AI】机器学习034 NLP对文本进行分词 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2, NLTK 3.3, jieba 0.39) 分词过程可以认为是自然语言处理(NLP)的第一
阅读全文
摘要:【火炉炼AI】机器学习035 NLP词干提取 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2, NLTK 3.3) 在英语中,经常会有很多单词的变形,记得以前英语老师讲课时,讲到动词的变形,有
阅读全文
摘要:【火炉炼AI】机器学习033 构建电影推荐系统 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 电影推荐系统内部最关键的部件是推荐引擎,和汽车的发动机一样,推荐引擎的作用是产生数据动力,提
阅读全文
摘要:【火炉炼AI】机器学习032 用户之间相似度的计算 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 在构建推荐引擎时,一般需要计算两个用户之间的相似度,以便找到与数据库中特定用户相似的用户
阅读全文
摘要:【火炉炼AI】机器学习031 KNN回归器模型的构建 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 在上一篇文章中我们学习了构建KNN分类器模型,但是KNN不仅可以用于分类问题,还可以用
阅读全文
摘要:【火炉炼AI】机器学习030 KNN分类器模型的构建 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) KNN(K nearest neighbors)是用K个最近邻的训练数据集来寻找未知对
阅读全文
摘要:【火炉炼AI】机器学习029 找到离你最近的邻居 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 最近邻算法的核心思想是:想要判断你属于哪一个类别,先找离你最近的K个邻居,看看这些邻居的大
阅读全文
摘要:【火炉炼AI】机器学习028 五分钟教你打造机器学习流水线 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 现在的社会工业化大生产离不开流水线作业,有了流水线,我们可以轻松的制造出成千上万
阅读全文
摘要:【火炉炼AI】机器学习027 项目案例:用聚类算法建立客户细分模型 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 客户细分是市场营销成功的前提,我们从市场中获取的数据一般都没有标记,要想
阅读全文
摘要:【火炉炼AI】机器学习026 股票数据聚类分析 近邻传播算法 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2, tushare 1.2) 有一位朋友很擅长炒股,听说其资产已经达到了两百多万,我
阅读全文
摘要:【火炉炼AI】机器学习025 自动估算集群数量 DBSCAN算法 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 在前面的文章 "【火炉炼AI】机器学习024 无监督学习模型的性能评估 轮
阅读全文
摘要:【火炉炼AI】机器学习024 无监督学习模型的性能评估 轮廓系数 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 前面我们学习过监督学习模型的性能评估,由于数据集有标记,所以我们可以将模型
阅读全文
摘要:【火炉炼AI】机器学习023 使用层次聚类算法构建模型 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 聚类的算法有很多种,前面我们讲解了k means算法和均值漂移算法,此处我们继续讲解
阅读全文
摘要:【火炉炼AI】机器学习022 使用均值漂移聚类算法构建模型 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 无监督学习算法有很多种,前面已经讲解过了K means聚类算法,并用该算法对图片
阅读全文
摘要:【火炉炼AI】机器学习021 使用K means进行图片的矢量量化操作 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 前一篇文章我们讲解了K means算法的定义方法,并用K means
阅读全文
摘要:【火炉炼AI】机器学习020 使用K means算法对数据进行聚类分析 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 前面的机器学习类文章(编号从010 019)都是关于 监督学习 ,但
阅读全文
摘要:【火炉炼AI】机器学习019 项目案例:使用SVM回归器估算交通流量 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 我们都知道,SVM是一个很好地分类器,不仅适用于线性分类模型,而且还适
阅读全文
摘要:【火炉炼AI】机器学习018 项目案例:根据大楼进出人数预测是否举办活动 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 我们经常看到办公大楼中人来人往,进进出出,在平时没有什么活动的时候
阅读全文
摘要:【火炉炼AI】机器学习016 如何知道SVM模型输出类别的置信度 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 一般的,对于未知样本,我们通过模型预测出来属于某种类别,往往会给出是这种类
阅读全文
摘要:【火炉炼AI】机器学习017 使用GridSearch搜索最佳参数组合 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 在前面的文章( "【火炉炼AI】机器学习012 用随机森林构建汽车评
阅读全文
摘要:【火炉炼AI】机器学习015 如何处理样本数偏差较大的数据集 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 我们得到的数据集在绝大多数情况下,都不是理想的数据集,都需要经过各种各样的处理
阅读全文
摘要:【火炉炼AI】机器学习014 用SVM构建非线性分类模型 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 支持向量机(Support Vector Machine,SVM)是一种常见的判别
阅读全文
摘要:【火炉炼AI】机器学习013 用朴素贝叶斯分类器估算个人收入阶层 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 每个人都有权利追求幸福的生活,我等屌丝也不例外,但是,怎么样才能知道自己到
阅读全文
摘要:【火炉炼AI】机器学习012 用随机森林构建汽车评估模型及模型的优化提升方法 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 在前面的文章中( "【火炉炼AI】机器学习007 用随机森林构
阅读全文
摘要:【火炉炼AI】机器学习011 分类模型的评估:准确率,精确率,召回率,F1值 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 在前面的( "【火炉炼AI】机器学习004 岭回归器的构建和模
阅读全文
摘要:【火炉炼AI】机器学习010 用朴素贝叶斯分类器解决多分类问题 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 前面讲到了使用逻辑回归分类器解决多分类问题( "【火炉炼AI】机器学习009
阅读全文
摘要:【火炉炼AI】机器学习009 用逻辑回归分类器解决多分类问题 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 前面的 "【火炉炼AI】机器学习008" 已经讲解了用简单线性分类器解决二分类
阅读全文
摘要:【火炉炼AI】机器学习008 简单线性分类器解决二分类问题 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 分类问题,就是将数据点按照不同的类别区分开来,所谓人以类聚,物以群分,就是这个道
阅读全文
摘要:【火炉炼AI】机器学习007 用随机森林构建共享单车需求预测模型 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 共享单车是最近几年才发展起来的一种便民交通工具,基本上是我等屌丝上班,下班
阅读全文
摘要:【火炉炼AI】机器学习006 用决策树回归器构建房价评估模型 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 最近几十年,房价一直是中国老百姓心中永远的痛,有人说,中国房价就像女人的无肩带
阅读全文
摘要:【火炉炼AI】机器学习005 多项式回归器的创建和测试 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 前面讲到了简单线性回归器和岭回归器,这两类回归器都是将数据集拟合成直线,但现实生活中
阅读全文
摘要:【火炉炼AI】机器学习004 岭回归器的构建和模型评估 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 在我的上一篇文章( "【火炉炼AI】机器学习003 简单线性回归器的创建,测试,模型
阅读全文
摘要:【火炉炼AI】机器学习003 简单线性回归器的创建,测试,模型保存和加载 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 回归分析是一种基于现有数据集,从现有数据集中寻找数据规律的一种建模
阅读全文
摘要:【火炉炼AI】机器学习002 标记编码方法 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 监督学习中的标记的形式有各种各样,比如对于人脸识别的标记,可能是[“小红”,“小花”,“翠花”。
阅读全文
摘要:【火炉炼AI】机器学习001 数据预处理技术(均值移除,范围缩放,归一化,二值化,独热编码) (【本文所使用的Python库和版本号】: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 数据预处理的必要性:在真实世界中,经常需要
阅读全文