第一步--开篇

随着工作的深入,对于统计分析的研究也越来越深。继去年对于统计学进行了一次系统性学习之后,从现在开始会进行一次整体的梳理和记录。

针对上面的结构图,给出关键性的问题和解答:

【1】什么是统计学?

答:统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。本质来说,就是一种数据的变形,也就是数据分析,由海量无法知晓的数据转换为信息!为互联网行业的数据分析领域提供了较为多样化的方法论:有直观的图表、基于数学严谨性的方法、数据挖掘手段等。这些必备知识是我们开启整个分析工作必备的砝码。

【2】统计学方法分类?

答:描述统计和推断统计。千万不要小看这两个概念,这是整个统计学的核心。面对数据,我们当然希望从总体上去观察分析,也就是描述统计。但是这种分析方法常常受到数据量和计算成本的制约。于是不得不采用“样本推断总体”的方式去进行考察。最典型的例子,针对某一个网站上线了某一功能,如果用户数庞大,我们如何判断用户对于该项目的整体满意情况?是通过每一个用户的行为来进行逐个分析吗?当然不是,我们需要选取个体,利用个体来推断总体。(借鉴于生产工艺中灯泡寿命的评估)。

【3】如果说统计学是一个圈,我们如何在这个圈内划分类别?

答:对于统计学来说,常用的类型主要有按时间状况和按计量尺度划分。两种不同的划分,为我们提供了两种看待应用的方式。按时间状况划分实际上就是一个短期和长期的考虑,面对数据,截面数据告诉我们当前产品的形态和模式,利用多种手段总和,知晓整体指标体系下的现状,方便下一次的改善和决策,是迭代模型中的下一个step,典型表现就是产品特征和产品改进迭代;而时间序列数据则是一个产品长期规划的表征,是迭代模型中的下一个cycle,典型表现就是流量分析和趋势预测分析。而按计量尺度划分,则重点是截面数据的考察。针对不同数据类型有不同的分析手段。

posted on 2012-02-22 16:27  林语堂的生活  阅读(158)  评论(0编辑  收藏  举报

导航