02 2022 档案
摘要:Exploratory data analysis (EDA) 是一种分析数据的方法。通常用于建模之前,以便总结数据的主要特征,从而更好的了解数据集,提取各变量之间的关系。 以下将总结几种常用的方法。 Descriptive Statistics 通常在开始分析数据时,我们会粗略的浏览一下数据,而
阅读全文
摘要:数据清洗是数据分析非常关键的一个步骤,也是一个必须的步骤。 这里记录了主要是记录如果利用 Python 来理解原始数据以及清洗数据。比如说如何处理缺失值,如何处理字段乱码,如何统一日期格式等等。 Handling Missing Value 对于某个字段内的缺失值,我们首先要分析一下为什么会出现缺失
阅读全文