随笔分类 - 机器学习实战
摘要:变量的度量类型(名义,等级,连续) 名义:性别,民族等 等级:年级,有等级差别的 连续:肯定是数值型的,差值相等 连续变量可以通过分组的方式转化成等级变量来用,有利于消除噪音。 名义变量只有频次和百分比两个统计量 名义变量和等级变量统称分类变量 连续变量 对称用均值,偏移用中位数 数学符号读作c阁马
阅读全文
摘要:In [49]: frame2 Out[49]: year state pop debt one 2000 Ohio 1.5 NaN two 2001 Ohio 1.7 NaN three 2002 Ohio 3.6 NaN four 2001 Nevada 2.4 NaN five 2002 Ne
阅读全文