数据分析概述

数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括的过程。

数据分析的原则

数据分析必须遵循的原则主要有三条:

数据分析是为了验证假设性的问题,需要提供必要的数据验证。

数据分析是为了挖掘更多的问题,并找到深层次的原因。

不能为了做数据分析而做数据分析。

因此,在进行数据分析之前,要尽量明确数据分析针对的问题,然后带着问题进行数据分析。因为面对不同的问题,分析思路、分析方法甚至结果都可能大相径庭。

你可以先围绕数据,大概地问一堆问题,然后从中确定你要分析的问题,比如你希望通过数据分析来改善什么?目前通过网络营销带来的销售量有什么问题?流量最多能提升多少?网站主要针对的人群是什么?现在的转化率是否正常?等等。这些很不重要的问题,其实你可以从客户的回答中得到很多答案,从而来确定你要分析的问题。

数据分析的步骤

典型的数据分析包含以下基本步骤:

1、探索性数据分析

初次拿到数据的时候,可能会感觉到杂乱无章、看不出规律。探索性数据分析就是在这种情况下帮助我们找到头绪。

探索性数据分析通过是通过作图、造表、用各种形式的方程拟合,计算某些特征量等手段探索规律性的可能形式,即往什么方向和用何种方式去寻找和揭示隐含在数据中的规律性。

探索性数据分析是启发式、开放式和完全动态的。

2、模型选定分析

探索性分析的基础上,通过定量分析方法,提出一类或几类可能的模型,然后通过进一步的分析,从中挑选一类合适的模型。

3、推断分析

通常使用数理统计方法,进行一系列的计算和分析,对所定模型或估计的可靠程度和精确程度作出推断。

数据分析的过程

数据分析的过程通常包括明确目标、收集数据、加工整理、选择方法和解释结果。

1、明确目标

数据分析的出发点,明确数据分析要研究的主要问题和预期的分析目标等。

2、收集数据

正确的收集数据是实现数据分析目标的关键,是指从分析目标出发,排除干扰因素,正确收集服务于既定分析目标的数据。

3、加工整理

收集到正确数据之后,往往能够需要对其进行必要的加工整理,而后才能用于真正用于数据分析。

4、选择方法

选择集中统计分析方法对数据进行探索性的反复分析是非常重要的,每一种统计分析方法都有自己的特点和局限性,一番需要选择几种方法反复印证分析,仅依靠一种分析方法的结果就断然下结论是不科学的。

选择数据分析方法应该避免盲目的“拿来主义”,应切忌滥用和勿用统计分析方法。

5、解释结果

数据分析的直接结果是统计量和统计参数。正确理解它们的统计含义是得出一切分析结论的基础,它不仅能帮助人们有效避免毫无根据地随意引用统计数字的错误,同时也是证实分析结论正确性和可信性的依据,而这一切都取决于人们能否正确地八五统计分析方法的核心思想。

数据分析的对象

常见的数据分析的对象有以下7大类:

关系型数据库、事务性数据库、面向对象的数据库

数据仓库/多维数据库

空间数据(如地图信息)

工程数据(如建筑、集成电路的信息)

文本和多媒体数据(如文本、图像、音频、视频数据)

时间相关的数据(如历史数据或股票交易数据)

互联网(如半结构化的HTML、结构化的XML以及其他网络信息)

 

posted @ 2015-03-23 23:12  HH番茄  阅读(207)  评论(0编辑  收藏  举报