上一页 1 ··· 20 21 22 23 24 25 26 27 28 ··· 31 下一页
摘要: 1.3Matplotlib速成 matplotlib是python中著名的2D绘图库,使用方法比较简单,按照以下三步操作就能很简单地完成绘图。 (1)调用plot(),scatter()等方法,并为绘图填充数据,数据是numpy的ndarray类型对象; (2)设定数据标签,使用xlabel()、y 阅读全文
posted @ 2020-01-19 11:18 泰初 阅读(382) 评论(0) 推荐(0) 编辑
摘要: 1.2 NumPy速成 numpy为scipy提供了基本的数据结构和运算,其中最主要的是ndarray多维数组,它提供了高效的适量运算功能。 1.2.1创建数组 #根据列表创建数组 import numpy as np myarray = np.array([1,2,3]) print(myarra 阅读全文
posted @ 2020-01-19 10:45 泰初 阅读(384) 评论(0) 推荐(0) 编辑
摘要: 1.1python速成 1.1.1基本数据类型和赋值运算 字符串 data ='hello world!' print(data[0]) print(data[1:5]) print(len(data)) print(data) 数值 value=523 print(value) value=6.1 阅读全文
posted @ 2020-01-18 22:01 泰初 阅读(493) 评论(0) 推荐(0) 编辑
摘要: 2 模型评估与选择 2.1评估方法 2.1.1训练集和测试集 实例1:鸢尾花数据集(Iris) 鸢尾花数据集(Iris)是一个经典数据集。数据集内包含 3 类共 150 条记录,每类各 50 个数据,每条记录都有 4 项特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度,可以通过这4个特征预测鸢尾花卉属于 阅读全文
posted @ 2020-01-18 21:41 泰初 阅读(1106) 评论(0) 推荐(0) 编辑
摘要: 六、sklearn中的分类性能指标 机器学习中常使用 sklearn 完成对模型分类性能的评估,我们需要掌握使用 sklearn 提供的以下接口: accuracy_score 准确度 precision_score 精准率 recall_score 召回率 f1_score F1 Score ro 阅读全文
posted @ 2020-01-18 21:14 泰初 阅读(1044) 评论(0) 推荐(0) 编辑
摘要: 五、衡量分类任务的性能指标 5、ROC曲线与AUC (1)ROC曲线 ROC曲线( Receiver Operating Cha\fracteristic Curve )描述的 TPR ( True Positive Rate )与 FPR ( False Positive Rate )之间关系的曲 阅读全文
posted @ 2020-01-18 20:23 泰初 阅读(1254) 评论(0) 推荐(0) 编辑
摘要: 五、衡量分类任务的性能指标 3、精准度与召回率 精准率(Precision)指的是模型预测为 Positive 时的预测准确度,其计算公式如下: 召回率(Recall)指的是我们关注的事件发生了,并且模型预测正确了的比值,其计算公式如下: 混淆矩阵: 真实预测01 0 TN FP 1 FN TP 举 阅读全文
posted @ 2020-01-14 22:45 泰初 阅读(1437) 评论(0) 推荐(0) 编辑
摘要: 五、衡量分类的性能指标 1、准确度的陷阱 准确度(正确率)越高就能说明模型的分类性能越好吗? 答:非也!举个例子,现在我开发了一套癌症检测系统,只要输入你的一些基本健康信息,就能预测出你现在是否患有癌症,并且分类的准确度为 0.999。但是我们知道,一般年轻人患癌症的概率非常低,假设患癌症的概率为 阅读全文
posted @ 2020-01-13 17:27 泰初 阅读(944) 评论(0) 推荐(0) 编辑
摘要: 四、衡量回归的性能指标 1、均方误差-MSE(Mean Squared Error) 其中y^i表示第 i 个样本的真实标签,p^i表示模型对第 i 个样本的预测标签。 线性回归的目的就是让损失函数最小。那么模型训练出来了,我们在测试集上用损失函数来评估模型就行了。 2、均方根误差-RMSE(Roo 阅读全文
posted @ 2020-01-13 17:20 泰初 阅读(1984) 评论(0) 推荐(0) 编辑
摘要: 三、评估方法 1、留出法(hold-out) 直接将数据集D划分为两个互斥的集合,其中一个集合作为训练集S,另一个作为测试集T,即D = S ∪ T,S ∩ T = ø 。在 S 上训练出模型后,用 T 来评估其测试误差,作为对泛化误差的估计。 举例: 以二分类任务为例,假定 D 包含1000个样本 阅读全文
posted @ 2020-01-13 17:18 泰初 阅读(2355) 评论(0) 推荐(0) 编辑
上一页 1 ··· 20 21 22 23 24 25 26 27 28 ··· 31 下一页