03 2020 档案
摘要:用KNN算法来进行数字识别,还是用sklearn自带的digits数据集。 除了训练那部分,代码几乎都是抄前文的。可以看到用sklearn库非常方便。结果也很好,准确率98%。 KNN的准确率远高于MLP分类器,原因是MLP在小数据集上容易过拟合。而且MLP对于参数调整比较敏感。 接下来是强化学习。
阅读全文
摘要:手写识别实例,用神经网络实现。 手写识别是一个多分类任务,共有10个分类,即0 9。 图像识别是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。一般经历文字识别,数字图像处理与识别和物体识别。 用DBRHD数据集,在这里下载: http://archive.ics.uc
阅读全文
摘要:本文根据Jin Liang的《Getting Started with Machine Learning》ver 0.96而写,基本上就是翻译,但并不是逐字翻译。 第一部分 机器学习基础 01.概述 应用:自动驾驶,面部识别,垃圾邮件识别,信用卡欺诈识别,机器验伤,销售预测,语音识别,机器人。 深度
阅读全文
摘要:岭回归 解决某些训练样本线性相关,导致回归结果不稳定的情况。 它是一种用于共线性数据分析的有偏估计回归方法。是一种改良的最小二乘估计法。 在sklearn中使用sklearn.linear_model.Ridge进行。 课程的实例是交通流量预测,我找不到数据文件,从网上自己找个例子吧。 用波士顿房价
阅读全文
摘要:多项式回归 研究一个或多个自变量与一个因变量间多项式的回归分析方法。如果一个自变量,为一元多项式回归。自变量为多个时,为多元多项式回归。多项式回归使用曲线拟合数据的输入与输出的映射关系。 实例,还是预测房价。 用sklearn.preprocessing.PolynomialFeatures函数。
阅读全文
摘要:讲有监督学习的线性回归。 线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。 只有一个自变量的回归称简单回归,大于一个变量的情况称多元回归。 用途:预测、分析变量与因变量关系的强度。 实例:对房屋尺寸与房价进行线性回归,预测房价。 分析:数据可视化,
阅读全文
摘要:用分类算法进行上证指数涨跌预测。 根据今天以前的150个交易日的数据,预测今日股市涨跌。 交叉验证的思想:将数据集D划分为k个大小相似的互斥子集,每个子集都尽可能保持数据分布的一致性,即从D中通过分层抽样来得到。然后,每次用k 1个子集的并集作为训练集,余下的那个子集作为测试集。这样可以获得k组训练
阅读全文

浙公网安备 33010602011771号