02 2022 档案

摘要:Exploratory data analysis (EDA) 是一种分析数据的方法。通常用于建模之前,以便总结数据的主要特征,从而更好的了解数据集,提取各变量之间的关系。 以下将总结几种常用的方法。 Descriptive Statistics 通常在开始分析数据时,我们会粗略的浏览一下数据,而 阅读全文
posted @ 2022-02-16 14:05 yukiwu 阅读(174) 评论(0) 推荐(0) 编辑
摘要:数据清洗是数据分析非常关键的一个步骤,也是一个必须的步骤。 这里记录了主要是记录如果利用 Python 来理解原始数据以及清洗数据。比如说如何处理缺失值,如何处理字段乱码,如何统一日期格式等等。 Handling Missing Value 对于某个字段内的缺失值,我们首先要分析一下为什么会出现缺失 阅读全文
posted @ 2022-02-09 17:54 yukiwu 阅读(57) 评论(0) 推荐(0) 编辑