究竟什么是报表最重要的?
大数据风起云涌,各种大数据的分析比比皆是。到底什么是大数据,大数据又能带给我们什么。
大数据是因为处理海量数据的能力越来越强才越来越热的。动不动的海量数据分析,让传统统计学的抽样啊什么的都显得不那么重要了。
计算能力上去了,存储的数据也有了,那么大数据我们怎么用呢?
1.必须要熟悉要分析的业务。经常会有这样的赶脚,数据就在手中,但是我却不知道该怎么分析。因为不了解细节,分析便抓不住重点。这也是为什么虽然报表出了很多,但是却不能给看报表的人有任何有价值的建议的原因。了解业务,把握重点,去掉无用的数据,这才是做数据分析的重中之重。
2.确定这次数据分析的主题,看报告的受众是谁,我想表达一个什么样的事情。这个过程很像写作文的列提纲的过程。站在受众的角度考虑问题,他想知道什么,他想看到什么,我又能做什么给他好的建议呢。
3.下一步应该就是撰写了。我感觉写数据分析报告,就像写作文一般。一个好的数据报告会像一个故事一样引人入胜。数据分析有两种情况,一种是平台级别的,一种是针对某种情况生成的报告。针对某个特定主题,有针对的利用部分数据,有点像自由作文,给你一个主题,题材不限,自由发挥。平台级别的貌似是一种框架,数据是不断变化的,所以你需要有一定的普适性。
4.语言的组织,同样的数据,同样的算法,你从哪种角度看,从哪种角度分析,得到的效果是不一样的。比方说,有一组数据,我们可以求得这组数据的平均数,中位数,众数。这三种数据的求法和计算方法其实已经特别成熟了。我们通常会这么表述,前三个月该指标数据的平均数为23ms,中位数为32ms,众数为24ms.数也拿到了,计算也完成了。但是直接写出来,除非专业人士没有人能看懂,这表示了什么意义。于是,我们可以这样写。过去的三个月里,该数据指标的平均表现为23ms,有一半的时间是超过32ms的,大部分出现24ms。这种表述方法更加的显浅易懂,且效果会更好。读者并不一定都是统计学专业的,没必要把专业术语都表示给他们看。
5.根据要展现的东西,我们去找合适的图。网上有个很好的图。我贴在这里。