摘要: 1.关于年龄Age 除了利用平均数来填充,还可以利用正态分布得到一些随机数来填充,首先得到已知年龄的平均数mean和方差std,然后生成[ mean-std, mean+std ]之间的随机数,然后利用这些随机值填充缺失的年龄。 2.关于票价Fare 预处理:训练集不缺,测试集缺失1个,用最高频率值 阅读全文
posted @ 2017-10-01 21:57 三年一梦 阅读(1822) 评论(0) 推荐(0) 编辑
摘要: 对于给定的一张图像,可能边缘或者无效信息较多,所以需要将图像主要内容分离出来,这里对于特定的图片给出一个小例子。 对于此图(左)来说,两边的无效信息较多,字母主要集中在中间部分。对于少量图而言可以手动去掉两边的空白成为右图。可是对于成千上万张图片需要一种特定的方法。观察到数字主要集中在中间并且为大量 阅读全文
posted @ 2017-10-01 10:50 三年一梦 阅读(1203) 评论(0) 推荐(0) 编辑