随笔分类 -  机器学习

摘要:一:使用逻辑回归来识别手写数字(0-9) (一)导入库,并且读取数据集 因为我们的数据集类型是.mat文件(是在matlab的本机格式),所以在使用python加载时,我们需要使用一个SciPy工具。 import numpy as np import pandas as pd import mat 阅读全文
posted @ 2020-05-02 12:49 山上有风景 阅读(684) 评论(0) 推荐(0) 编辑
摘要:一:建立一个逻辑回归模型来预测一个学生是否被大学录取。 假设你是一个大学系的管理员,你想根据两次考试的结果来决定每个申请人的录取机会。 你有以前的申请人的历史数据,你可以用它作为逻辑回归的训练集。 对于每一个培训例子,你有两个考试的申请人的分数和录取决定。 为了做到这一点,我们将建立一个分类模型,根 阅读全文
posted @ 2020-05-01 23:28 山上有风景 阅读(1196) 评论(0) 推荐(0) 编辑
摘要:到现在为止,我们已经学习了几种不同的学习算法,包括线性回归和逻辑回归,它们能够有效地解决许多问题,但是当将它们应用到某些特定的机器学习应用时,会遇到过拟合(over-fitting)的问题,可能会导致它们效果很差。 一:过度拟合问题 (一)线性回归中的过拟合问题 继续使用线性回归来预测房价的例子,我 阅读全文
posted @ 2020-05-01 11:17 山上有风景 阅读(1006) 评论(0) 推荐(0) 编辑
摘要:一:分类 (一)分类基础 在分类问题中,你要预测的变量y是离散的值,我们将学习一种叫做逻辑回归 (Logistic Regression) 的算法,这是目前最流行使用最广泛的一种学习算法。 在分类问题中,我们尝试预测的是结果是否属于某一个类(例如正确或错误)。分类问题的例子有:判断一封电子邮件是否是 阅读全文
posted @ 2020-04-30 20:53 山上有风景 阅读(2310) 评论(0) 推荐(0) 编辑
摘要:补充:特征归一化,意义、方法、使用场景 一:单变量线性回归 (一)导入需要使用的包 import numpy as np import pandas as pd import matplotlib.pyplot as plt (二)导入数据集 注意:一定要将数据文件放在和程序同一个文件夹中,否则要使 阅读全文
posted @ 2020-04-27 23:38 山上有风景 阅读(3189) 评论(0) 推荐(3) 编辑
摘要:一:多维特征 目前为止,我们探讨了单变量/特征的回归模型,现在我们对房价模型增加更多的特征,例如房间数楼层等,构成一个含有多个变量的模型,模型中的特征为(X_1,X_2,...,X_n) 每一行都是一个训练集样本。 二:多元梯度下降法 与单变量线性回归类似,在多变量线性回归中,我们也构建一个代价函数 阅读全文
posted @ 2020-04-27 21:23 山上有风景 阅读(987) 评论(0) 推荐(0) 编辑
摘要:一:线性回归(了解监督学习过程) (一)概念 线性回归,首先要介绍一下机器学习中的两个常见的问题:回归任务和分类任务。那什么是回归任务和分类任务呢?简单的来说,在监督学习中(也就是有标签的数据中),标签值为连续值时是回归任务,标签值是离散值时是分类任务。 线性回归模型就是处理回归任务的最基础的模型。 阅读全文
posted @ 2020-04-27 13:08 山上有风景 阅读(695) 评论(0) 推荐(1) 编辑
摘要:一:机器学习定义 一个程序被认为能够从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了P的评判后,程序在处理T时的性能有所提升。 举例:下棋游戏中,经验e就是程序上万次的自我练习的经验,而任务t就是下棋。性能度量值p就是与新的对手比赛时赢的比赛的概率。 二:监督学习与非监督学习 (一)监督 阅读全文
posted @ 2020-04-26 21:11 山上有风景 阅读(305) 评论(0) 推荐(0) 编辑
摘要:一:Numpy库 https://blog.csdn.net/yxjsmile/article/details/104519982 二:Pandas库 https://blog.csdn.net/qq_34430163/article/details/104855802 三:Matplotlib库 阅读全文
posted @ 2020-04-22 22:32 山上有风景 阅读(240) 评论(0) 推荐(0) 编辑
摘要:scikit-learn 库是当今最流行的机器学习算法库之一,可用来解决分类与回归问题 一:数据集的预处理 本章以鸢尾花数据集(公开数据集)为例,简单了解八大传统机器学习分类算法的sk-learn实现 (一)数据集的下载 import seaborn as sns #从seaborn库中下载数据集 阅读全文
posted @ 2020-04-21 11:34 山上有风景 阅读(733) 评论(0) 推荐(0) 编辑
摘要:说明:0轴axis=0和1轴axis=1 简介 一:数据的排序 二:数据的基本统计分析 三:数据的累积统计分析 四:数据的相关分析 一:数据的排序 0 1 2 3 4 a 0 1 2 3 4 b 5 6 7 8 9 c 10 11 12 13 14 d 15 16 17 18 19 4 3 2 1 阅读全文
posted @ 2018-07-11 23:22 山上有风景 阅读(462) 评论(0) 推荐(0) 编辑
摘要:简介 一:Pandas库的介绍 二:Pandas库的Series类型 (一)索引 (1)自动索引 (2)自定义索引 (二)Series类型创建 (1)列表创建 (2)标量值创建 (3)字典类型创建(将字典键作为索引) (4)从ndarray类型创建 (三)基本操作 三:Pandas库的DataFra 阅读全文
posted @ 2018-07-11 21:15 山上有风景 阅读(444) 评论(0) 推荐(0) 编辑
摘要:一:基本绘图函数(这里介绍16个,还有许多其他的) 二:pyplot饼图plt.pie的绘制 三:pyplot直方图plt.hist的绘制 (一)修改第二个参数bins:代表直方图的个数,均分为多段,取其中的每段均值 (二)normed为1代表我们要使用归一化数据(所占比例)在y轴,为0表示每个期间 阅读全文
posted @ 2018-07-11 14:57 山上有风景 阅读(3677) 评论(0) 推荐(0) 编辑
摘要:简介: 一:Matplotlib库的介绍 (一)简单使用 二:区域划分subplot 三:plot函数 四:pyplot的中文显示 (一)方法一:修改rcParams参数 (二)方法二(推荐),在有中文地方增加属性:fontproperties 五:pyplot的文本显示方法 六:pyplot的子绘 阅读全文
posted @ 2018-07-11 10:50 山上有风景 阅读(457) 评论(0) 推荐(0) 编辑
摘要:简介 一:数据的CSV文件存取(一维或二维) (一)写入文件savetxt (二)读取文件loadtxt 二:多维数据的存取 (一)保存文件tofile (二)读取文件fromfile (三)NumPy 的便捷文件存取save/savez或load 三:NumPy的随机数函数(random模块) r 阅读全文
posted @ 2018-07-10 20:20 山上有风景 阅读(399) 评论(0) 推荐(0) 编辑
摘要:概括: 一:数据维度 (一)一维数据 (二)二维数据 (三)多维数据 (四)高维数据 二:Numpy的数组对象:ndarray (一)Numpy介绍 (二)N维数组对象ndarray (三)ndarray的元素类型 (四)当ndarray数组由非同质对象构成时 三:ndarray数组的创建方法 (一 阅读全文
posted @ 2018-07-10 16:40 山上有风景 阅读(458) 评论(0) 推荐(0) 编辑