摘要: 本文翻译自文章: Pandas Cheat Sheet - Python for Data Science ,同时添加了部分注解。 对于数据科学家,无论是数据分析还是数据挖掘来说,Pandas是一个非常重要的Python包。它不仅提供了很多方法,使得数据处理非常简单,同时在数据处理速度上也做了很多优 阅读全文
posted @ 2017-05-24 16:47 L.P.B_Blizzard 阅读(1033) 评论(0) 推荐(0) 编辑
摘要: 常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍; 1. 标准化(Standardization or Mean Removal and Variance Scaling) 变换后各维特征有0均值,单位方差。也叫z-score规范化(零均值规范化)。计算方式是将特征 阅读全文
posted @ 2017-05-24 08:40 L.P.B_Blizzard 阅读(344) 评论(0) 推荐(0) 编辑
摘要: 数据导入到python环境:http://pandas.pydata.org/pandas-docs/stable/io.html(英文版) IO Tools (Text, CSV, HDF5, ...)¶ The pandas I/O API is a set of top level reade 阅读全文
posted @ 2017-05-24 07:41 L.P.B_Blizzard 阅读(6598) 评论(0) 推荐(0) 编辑