关于SQL和python数据预处理

关于SQL需要掌握:

  1、提取特定情况下的数据,比如提取2017年的数据,提取前100个顾客的数据等

  2、数据库的增、删、查、改,这些命令都很简单,记住即可

  3、数据的分组聚合、如何建立多个表之间的联系,这在处理多维度、多个数据集时很有用

对于以上,需要掌握一些基本的操作,找一些数据集练习一下即可

****************************************************************************

关于python进行数据预处理,对于数据预处理,学会 pandas (Python包)的用法,应对一般的数据清洗就完全没问题了。需要掌握的知识点如下:

  • 选择:数据访问(标签、特定值、布尔索引等)

  • 缺失值处理:对缺失数据行进行删除或填充

  • 重复值处理:重复值的判断与删除

  • 异常值处理:清除不必要的空格和极端、异常数据

  • 相关操作:描述性统计、Apply、直方图等

  • 合并:符合各种逻辑关系的合并操作

  • 分组:数据划分、分别执行函数、数据重组

  • Reshaping:快速生成数据透视表

posted @ 2018-03-13 23:51  歪胡子的日常  阅读(1286)  评论(0编辑  收藏  举报