随笔分类 -  机器学习

摘要:import pandas as pdimport numpy as np pandas 有两个主要的数据结构:Series 和 DataFrame;Series 是一个一维数组对象 ,它包含一组索引和一组数据,可以把它理解为一组带索引的数组。DataFrame 是一个表格型的数据结构。它提供有序的 阅读全文
posted @ 2018-11-28 19:44 StarHai 阅读(3123) 评论(0) 推荐(0) 编辑
摘要:前言 这篇文章时承继上一篇机器学习经典模型使用归一化的影响。这次又有了新的任务,通过将label错位来对未来数据做预测。 实验过程 使用不同的归一化方法,不同得模型将测试集label错位,计算出MSE的大小; 不断增大错位的数据的个数,并计算出MSE,并画图。通过比较MSE(均方误差,mean-sq 阅读全文
posted @ 2018-11-23 02:09 StarHai 阅读(585) 评论(0) 推荐(0) 编辑
摘要:归一化 归一化也称标准化,是处理数据挖掘的一项基础工作,使用归一化的原因大体如下: 数据存在不同的评价指标,其量纲或量纲单位不同,处于不同的数量级。解决特征指标之间的可比性,经过归一化处理后,各指标处于同一数量级,便于综合对比。求最优解的过程会变得平缓,更容易正确收敛。即能提高梯度下降求最优解时的速 阅读全文
posted @ 2018-11-15 22:04 StarHai 阅读(3643) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示