数据分析六步(结合wrf)
1.明确数据分析的目的及内容 2.数据的来源和收集 3.数据的处理 4数据的分析 5后处理及可视化 6.撰写文档
一 、数据分析的六个模块
1.明确分析目的和内容
目的是你要干什么,内容是你要为你完成的这个目的进一步要分做的几块事务
2.数据收集
数据的来源有很多了,如互联网,如在wrf中,我们是在NCEP(美国环境 中心)上下载所像数据(数据的格式有两人种grib1和grib2).在每个公司每个业务都有对应的数据库,这也是我们的数据来源。
3.数据处理
你下载的数据不一定你可以直接使用,所以你要处理
包括
3.1数据清洗(如处理无效值,缺失值)
3.2数据转化(如格式的转化如你在气象局上下载的是十进制的,你要转为二进制的格式以后,才可以用grads软件处理)
3.3数据的提取(如我只要2012.07.12-2012.07.15 period的数据)
3.3数据的计算(如wrf.exe)
结:一般到手的数据都要经过一定处理才能用户后续分析工作
4.数据分析
这一步在第一个模块的时候就要有个大致的想法,现在是具体的实现
数据分析 或 数据挖掘 ----------->对处理过的数据进行分析--------->由于数据分析是通过软件来完成的,所以数据分析师不仅要掌握各种分析方法,还要熟悉数据分析软件的操作-------->一般的数据分析软件用excel------->高级的数据分析用spss statistic
结上一模块为这一模块准备要分析的数据,至于分析方法可以有很多如主成分分析法等
5.数据展现
即画图,制表 可视化
6.报告撰写
是为了给决策都 参考
将数据 分的的起因 过程 结果 及建议(解决方案)四部分完整的写出来,再由决策者作决策时参考 。
二、在统计学上数据的种类就分为两种,字符型 与 数值型
在统计学上方法的各类就分为两种,描述型分析 与 探索性分析(有时分三种还有一种叫验证型)
因为我们只可能对样本进行研究,而不是对总体。对样本特征进行描述的那部分统计学称为描述性统计,通过样本情况去对总体情况进行推断的那部分统计学称为推断统计。