04 2019 档案

摘要:一:三种方式 a.均方误差(MSE) b.均方根误差(RMSE) c.平均绝对误差(MAE) 二:评测公式 均方误差:对(y_test-y_test_predict)的平方求和,但是为了排除个数对数值的影响,我们将上述的值在进行除以y_test的大小。 均方根误差:对均方误差进行开根号。 平均绝对误 阅读全文
posted @ 2019-04-20 10:03 Coding_Now 阅读(309) 评论(0) 推荐(0) 编辑
摘要:一:定义 简单理解:y=ax+b,x是特征值,y是标记,模型就是计算a和b的值。 二:最优模型 尽量使的y的预测值与真实值的差小,即对 y-y(i)进行求和使其值最小,即(y-y(i))^2小。 主要是最小二乘法和对a,b求偏导,得出 a = 对 (x(i)-x的平均值)*(y(i)-y的平均值) 阅读全文
posted @ 2019-04-18 14:26 Coding_Now 阅读(287) 评论(0) 推荐(0) 编辑
摘要:一.传统的消息通信方式 a.Socket通信协议 缺点:服务器端和客户端必须同时在线;传输大量数据时,数据完全不完备,对网络要求极高。 b.文件服务器(ftp) 缺点:实时性比较差;本地磁盘IO读写; c.共享数据库方式(Database) 缺点:系统间访问共享数据库比较难实现:1.据库连接池有限的 阅读全文
posted @ 2019-04-12 14:37 Coding_Now 阅读(189) 评论(0) 推荐(0) 编辑
摘要:一:所在包 from sklearn.preprocessing import StandardScaler。 二:步骤 a.将训练集进行fit操作 b.在将训练集进行transform操作,得到均值为0,方差为1的数据集。 c.对测试集进行transform操作,但是不需要在进行fit,应使用训练 阅读全文
posted @ 2019-04-10 12:18 Coding_Now 阅读(1573) 评论(0) 推荐(0) 编辑
摘要:一:目的 数据归一化(标准化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。 二:分为 阅读全文
posted @ 2019-04-07 16:22 Coding_Now 阅读(1075) 评论(0) 推荐(0) 编辑
摘要:主要用到 sklearn.model_selection包下的GridSearchCV类。 总共分为几步: a.创建训练集和测试集 b.创建最优参数字典 c.构建GridSearchCV对象 d.进行数据训练 e.得出最优超参数 a.创建训练集和测试集 b.创建最优参数字典 c.构建GridSear 阅读全文
posted @ 2019-04-07 15:33 Coding_Now 阅读(983) 评论(0) 推荐(0) 编辑
摘要:一:定义 超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。 二:常用超参数 k近邻算法的k,权重weight,明可夫斯基距离公式的p,这三个参数都在KNeighborsClassifier类的构造函数中。 三:共同代码 四:k的最优数值 五:weight的最优数值 如果取值为u 阅读全文
posted @ 2019-04-07 12:39 Coding_Now 阅读(3710) 评论(0) 推荐(1) 编辑
摘要:本章,我们使用sklearn自带的手写识别的数据集进行计算准确度,进而巩固之前学的KNN算法。 本节主要是进行之前学的KNN算法进行巩固,进而为后续的学习打好基础。 阅读全文
posted @ 2019-04-07 10:17 Coding_Now 阅读(813) 评论(0) 推荐(0) 编辑
摘要:一:当我们训练出一个模型,我们不知道这个模型是好还是坏,我们如果应用到真实环境,结果预测的没有可信度,所以在输入样例之前先对模型进行测试。这时,我们就要将我们所有的数据分为两部分,一大部分用来训练,一小部分用来测试,一般比例在8:2。也就是我们会有两套数据集,一个是训练集,另一个是测试集。 二:鸢尾 阅读全文
posted @ 2019-04-04 13:38 Coding_Now 阅读(271) 评论(0) 推荐(0) 编辑
摘要:一:首先定义一个类,定义构造函数,对训练集进行赋值,fit和predict过程。 阅读全文
posted @ 2019-04-04 12:45 Coding_Now 阅读(290) 评论(0) 推荐(0) 编辑
摘要:一:机器学习流程 训练集-->机器学习算法-->生成模型-->输入样例-->得出结果。 二:KNN算法 然而我们在写KNN算法时并没有模型生成,KNN较特殊,KNN的模型就是训练集。 三:分为几步 a.指定key b.fit c.predict 四:代码 阅读全文
posted @ 2019-04-04 12:38 Coding_Now 阅读(336) 评论(0) 推荐(0) 编辑
摘要:一:KNN算法概念(K-Nearest Neighbor) 举个栗子:现在有10个点,突然我们又加了一个点,然后我们计算该点到其它点的距离从小到大排序,然后取前K个,查看该K个属于哪一部分的较多,那么我们就可以大概率的确定该点属于那一类。 图中蓝色点为我们新加的点,然后我们就是要确定这个蓝色的点属于 阅读全文
posted @ 2019-04-03 16:33 Coding_Now 阅读(213) 评论(0) 推荐(0) 编辑
摘要:一:读取数据 二:数据探索 阅读全文
posted @ 2019-04-01 13:14 Coding_Now 阅读(1293) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示