随笔分类 - 机器学习
摘要:import pandas as pdimport numpy as np pandas 有两个主要的数据结构:Series 和 DataFrame;Series 是一个一维数组对象 ,它包含一组索引和一组数据,可以把它理解为一组带索引的数组。DataFrame 是一个表格型的数据结构。它提供有序的
阅读全文
摘要:前言 这篇文章时承继上一篇机器学习经典模型使用归一化的影响。这次又有了新的任务,通过将label错位来对未来数据做预测。 实验过程 使用不同的归一化方法,不同得模型将测试集label错位,计算出MSE的大小; 不断增大错位的数据的个数,并计算出MSE,并画图。通过比较MSE(均方误差,mean-sq
阅读全文
摘要:归一化 归一化也称标准化,是处理数据挖掘的一项基础工作,使用归一化的原因大体如下: 数据存在不同的评价指标,其量纲或量纲单位不同,处于不同的数量级。解决特征指标之间的可比性,经过归一化处理后,各指标处于同一数量级,便于综合对比。求最优解的过程会变得平缓,更容易正确收敛。即能提高梯度下降求最优解时的速
阅读全文