摘要: 用KNN算法来进行数字识别,还是用sklearn自带的digits数据集。 除了训练那部分,代码几乎都是抄前文的。可以看到用sklearn库非常方便。结果也很好,准确率98%。 KNN的准确率远高于MLP分类器,原因是MLP在小数据集上容易过拟合。而且MLP对于参数调整比较敏感。 接下来是强化学习。 阅读全文
posted @ 2020-03-06 11:09 自由民 阅读(295) 评论(0) 推荐(0) 编辑
摘要: 手写识别实例,用神经网络实现。 手写识别是一个多分类任务,共有10个分类,即0 9。 图像识别是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。一般经历文字识别,数字图像处理与识别和物体识别。 用DBRHD数据集,在这里下载: http://archive.ics.uc 阅读全文
posted @ 2020-03-05 17:14 自由民 阅读(289) 评论(0) 推荐(0) 编辑
摘要: 本文根据Jin Liang的《Getting Started with Machine Learning》ver 0.96而写,基本上就是翻译,但并不是逐字翻译。 第一部分 机器学习基础 01.概述 应用:自动驾驶,面部识别,垃圾邮件识别,信用卡欺诈识别,机器验伤,销售预测,语音识别,机器人。 深度 阅读全文
posted @ 2020-03-04 19:25 自由民 阅读(593) 评论(0) 推荐(0) 编辑
摘要: 岭回归 解决某些训练样本线性相关,导致回归结果不稳定的情况。 它是一种用于共线性数据分析的有偏估计回归方法。是一种改良的最小二乘估计法。 在sklearn中使用sklearn.linear_model.Ridge进行。 课程的实例是交通流量预测,我找不到数据文件,从网上自己找个例子吧。 用波士顿房价 阅读全文
posted @ 2020-03-04 14:10 自由民 阅读(303) 评论(0) 推荐(0) 编辑
摘要: 多项式回归 研究一个或多个自变量与一个因变量间多项式的回归分析方法。如果一个自变量,为一元多项式回归。自变量为多个时,为多元多项式回归。多项式回归使用曲线拟合数据的输入与输出的映射关系。 实例,还是预测房价。 用sklearn.preprocessing.PolynomialFeatures函数。 阅读全文
posted @ 2020-03-03 15:12 自由民 阅读(270) 评论(0) 推荐(0) 编辑
摘要: 讲有监督学习的线性回归。 线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。 只有一个自变量的回归称简单回归,大于一个变量的情况称多元回归。 用途:预测、分析变量与因变量关系的强度。 实例:对房屋尺寸与房价进行线性回归,预测房价。 分析:数据可视化, 阅读全文
posted @ 2020-03-02 19:22 自由民 阅读(271) 评论(0) 推荐(0) 编辑
摘要: 用分类算法进行上证指数涨跌预测。 根据今天以前的150个交易日的数据,预测今日股市涨跌。 交叉验证的思想:将数据集D划分为k个大小相似的互斥子集,每个子集都尽可能保持数据分布的一致性,即从D中通过分层抽样来得到。然后,每次用k 1个子集的并集作为训练集,余下的那个子集作为测试集。这样可以获得k组训练 阅读全文
posted @ 2020-03-01 16:32 自由民 阅读(314) 评论(0) 推荐(1) 编辑
摘要: 有监督学习 常用分类算法 KNN:K近邻分类器。通过计算待分类数据点,与已知数据中所有点的距离,取距离最小的前K个点,根据"少数服从多数"的原则,将这个数据点划分为出现次数最多的那个类别。 在sklearn中,使用sklearn.neighbors.KNeighborsClassifier创建K邻近 阅读全文
posted @ 2020-02-29 22:03 自由民 阅读(363) 评论(0) 推荐(0) 编辑
摘要: 聚类的实际应用,图像分割。 利用图像的特征将图像分割为多个不相重叠的区域。 常用的方法有阈值分割,边缘分割,直方图法,特定理论(基于聚类,小波分析等)。 实例:利用k means聚类算法对图像像素点颜色进行聚类以分割图像。 输出:同一聚类的点以相同颜色表示,不同聚类的像素点以不同的颜色表示。 用PI 阅读全文
posted @ 2020-02-29 11:42 自由民 阅读(235) 评论(0) 推荐(1) 编辑
摘要: 降维 PCA算法及其应用 主成分分析(PCA),通常用于高维数据的探索与可视化。可以拔具有相关性的高维变量转化为线性无关的低维变量。称为主成分,能够尽可能保存原始数据的信息。 几个概念 方差:样本与样本均值的差的平方和的均值,用来度量一组数据的分散程度。 协方差:用于度量两个变量的线性相关程度。 特 阅读全文
posted @ 2020-02-28 18:21 自由民 阅读(330) 评论(0) 推荐(0) 编辑