7-数据分析思想
数据分析思想
-
1.数据分析概况
-
2.明确分析目的
-
3.确定分析思路
-
4.分析数据准备
-
5.数据处理方法
-
6.数据分析方法
-
7.数据展现方法
-
8.报告撰写方法
数据分析概况
数据分析概况
- What:数据分析定义
- 本质、规律、原理
- Why:数据分析作用
- 本质、规律、原理
- How:数据分析流程
- 方法、技巧、步骤
数据分析定义
- 数据分析指根据分析目的,用适当的分析方法及工具,对数据进行分析,提取有价值的信息,形成有效结论的过程。
数据分析三大作用
- 现状分析
- 发生了什么
- What
- 发生了什么
- 原因分析
- 为什么发生
- Why
- 为什么发生
- 预测分析
- 将要发生什么
- How
- 将要发生什么
数据分析流程
- 明确分析目的
- 确定分析思路
- 数据准备
- 数据处理
- 数据分析
- 数据展现与报告撰写
明确分析目的
菜鸟与数据分析师的区别
- 这图表真好看,怎么做的?
- 数据变化的背后真相是什么?
- 这数据可以做什么样的分析?
- 从哪些角度分析数据才体系?
- 高级的分析方法在这能用吗?
- 用什么分析方法最有效
- 要作多少张图表?
- 图表是否表达出有效的观点?
- 数据文字说明外还需要说什么?
- 数据分析的目的达到了吗?
- 数据分析报告要写多少页?
- 数据分析报告有说服力吗?
数据分析三大误区
- 分析目的不明确,为分析而分析
- 缺乏业务知识,分析结果偏离实际
- 追求高级分析方法,热衷研究模型
数据分析目的细分
- 了解现状
- 业务分析
- 用户分析
- 属性分析
- 行为分析
- 价值分析
- 效果分析
- 竞争分析
- 挖掘原因
- 业务变动
- 用户变动
- 指标变动
- 分析预测
- 数值预测
- 业务量
- 用户量
- 分类预测
- 用户响应
- 用户流失
- 数值预测
确定分析思路
确定分析思路
-
What:何谓分析思路?
-
Why:分析思路有何用?
-
How:如何确定分析思路?
何谓分析思路
- 分析思路=角度+步骤+方法
- 角度:具有逻辑顺序的结构,即结构化的分析框架
- 分析思路是有效指导数据分析工作开展的重要依据
分析思路作用
- 明确数据分析方向
- 明确采用的数据分析方法
- 确保数据分析结构体系化
确定分析思路方法
- 确定分析思路方法:根据分析目的,以营销、管理等方法理论(SWOT、PEST)为指导,构建结构化的数据分析框架,进一步确定分析内容与指标,以及采用的数据分析方法,以有效指导后期分析工作开展。
金字塔原理的逻辑顺序
- 要素顺序:构成事物的必要因素,如4P(4个角度),5W2H(7个角度)
- 结构顺序:具有结构关系的要素,如业务结构
- 时间顺序:具有时间顺序的要素,如业务流程
- 分析目的>>分析框架>>分析要点>>分析指标
分析思路构建基本准则
- 以终为始:目的>>框架>>要点>>指标
- 分解关系:逻辑关系(要素、结构、时间)
- MECE:相互独立、完全穷尽
- 二八原则:突出重点,关注关键的少数
数据分析方法论-5W2H
- What
- Why
- Who
- When
- Where
- How
- How much
数据分析方法论-4P
- Product
- Price
- Place
- Promotion
数据分析方法论-PEST
- 企业
- 政治环境
- 经济环境
- 技术环境
- 社会环境
数据分析方法论-AISAS
- 关注
- 兴趣
- 搜索
- 购买
- 分享
数据分析方法论-营销活动效果评估分析
- 传播效果
- 广度
- 到达率
- 曝光数
- 深度
- 频次分布
- 停留时长
- 广度
- 互动效果
- 数量
- 点击数
- 参与数
- 评论数
- 转发数
- 质量
- 参与率
- 数量
- 心里效果
- 知名度
- 记忆度
- 美誉度
- 忠诚度
- 转化效果
- 数量
- 新增用户数
- 消费用户数
- 运营收入
- 质量
- 用户平均贡献
- 投入产出比
- 数量
无方法论指导的构建方法
- 从下往上梳理组织分析思路
- 在纸上列举所有想到的重点
- 找出这些重点之间的逻辑关系:要素、时间、结构
- 整理概括成分析框架
分析数据准备
数据准备
- 数据理解(What):数据是什么样子?有何要求?
- 数据来源(Where):数据来源有哪些?
- 数据获取(How):数据如何获取?
数据理解-字段与记录
- 字段:是用于表示事务某种特征,字段也成为变量(统计学)、维度(分析);
- 记录:是事务某种特征的具体表现,记录也称为数据、变量值、维度值。
数据理解-字段数据类型
- 字符型字段:不具有算数运算能力的文本数据类型,它包括中文、英文、数字(非数值型)等字符,属于分类数据;
- 数值型字段:表示数量,可进行算数运算的数据类型,是否可用算术方法进行运算,是区分数据类型的重要特征,它是一种特殊的分类数据。
数据理解-一维表
- 一维表:也称为流水表、数据清单、判断标准就是看其列的内容:每一列是否是一个独立的变量,如果是,即为一维表,否则为二维表或多为表
数据理解-数据要求
- 数据表由标题行(字段)和数据部分(记录)组成
- 第一行是表的字段名,不能重复
- 第二行起是数据部分,数据部分的每一行数据称为一个条记录,并且数据部分不允许出现空白行和空白列,数据要保持完整性
- 一个单元格只记录一个属性数据,切勿复合记录,有一说一
- 数据表中不能有合并单元格存在
- 数据表要以一维表的形式存储
数据处理方法
数据处理
- What:数据处理是什么?
- Why:为何要进行数据处理?
- How:包含哪些处理方法?
- 数据清洗>>数据抽取>>数据合并>>数据计算>>数据转换
数据处理
- 根据数据分析目的,将收集的数据,用适当的处理方法进行加工、整理、形成适合数分析的要求样式
- 数据处理是数据分析前必不可少的阶段
数据处理目的
- 整理得到有价值、有意义的数据
- 将原始数据转化为可以分析的形式
- 保证数据的一致性和有效性
数据清洗
- 数据清洗就是将多余重复的数据筛选清除,将缺失的数据补充完整,将错误的数据纠正或删除。
- 重复数据处理
- 缺失数据处理
- 空格数据处理
数据抽取
- 数据抽取是指抽取原数据表中某些字段的部分信息,形成一个新字段
- 字段拆分
数据合并
- 数据合并是指综合数据表中某几个字段的信息,组合成一个新字段数据
- 字段合并
- 字段匹配
数据计算
- 数据计算就是根据原有的字段数据,采用简单、函数等计算方式得到新的字段数据;
- 简单计算
- 函数计算
- 标准化计算
- 数据分组
数据转换
- 数据类型转换
- 文本>>数值
- 数值>>日期
- 数值>>文本
- 二维表转一维表
数据分析方法
常用数据分析方法
- 现状分析
- 对比分析法
- 分组分析法
- 分布分析法
- 结构分析法
- 排序分析法
- 交叉分析法
- 矩阵关联分析法
- 综合评价分析法
- 原因分析
- 结构分解法
- 因素分解法
- 漏斗图分析法
- 预测分析
- 趋势分析法
对比分析法
- 对比分析法是指将两个或两个以上的数据进行比较,分析它们的差异性,从而揭示事务发展变化情况和规律性
- 特点:通过对比分析,可非常直观地看出指标的变化或差距,并且可准确、量化地表示出这种变化或差距是多少
- 对比是分析的最基本方法
- 对比分析的对象要具有可比性
- 对比的指标口径范围、计算方法、计量单位必须一致,即要用同一种标准或单位去衡量
对比分析法要素
- 指标:用于衡量事物发展程度的单位或方法
- 绝对数:反映事物在一定时间、地点条件下的总规模、总水平的综合性指标
- 相对数:由两个有联系的指标对比计算而得到的数值,用来反映事物之间数量联系程度的综合指标
- 注意:在分析中,相对数使用时要与绝对数结合使用
数量与质量
- 数据分析时,可使用数量与质量两个角度进行问题分析
- 举例
- 收入-利润率
- 用户数-留存率、流失率
- 浏览量-购买转化率
- 人口数-渗透率
- 渠道数-覆盖率
- 目标用户数-参与率
对比分析法-对比角度
- 目标
- 年度目标
- 季度目标
- 月度目标
- 时间
- 环比
- 同比
- 定基比
- 空间
- 同级空间
- 先进空间
- 扩大空间
- 特定
- 平均值
- 经验值
- 理论值
分组分析法
- 分组分析法是根据分析对象的某种特征,把分析对象划分为不同的部分,以进行各组之间对比分析,研究分析对象的结构、分布规律
- 分组类型
- 定量分组(分布分析):根据分析目的将数值型数据进行等距或非等距的分组
- 定性分组(结构分析):按事物属性划分,计算各组成部分所占比重
常用的商品分类维度
- 销售情况
- 畅销、平销、滞销
- 价格和质量
- 高档、中档、低档
- 商品耐久性
- 耐用品、消耗品
- 综合分类
- 大类、中类、小类、单品
- 顾客选择程度
- 便利品、选购品、特殊品
- 商品销售比重
- 主力商品、辅助商品、关联商品
常用的客户分类维度
- 人口属性
- 性别、年龄、地域、职业、教育、收入
- 客户价值
- 消费贡献、流量贡献
- 行为方式
- 消费品牌、时间、方式、频率等
- 态度
- 消费动机、价值观、生活方式
排序分析法
- 排序分析法是根据分析对象按数值大小进行升降序排列、以便重点突出前N名和后N名
- 如X轴无数值分布、时间顺序,建议按数值大小进行排序
- 排序分析法主要用于用户偏好等分析上,如榜单
交叉分析法
- 交叉分析法通常用于分析两个或两个以上分组变量(字段)之间的关系,以交叉表形式进行变量间关系的对比分析
矩阵关联分析法
- 矩阵关联分析法是指根据事物的两个重要指标作为分析的依据,进行关联分析,找出解决问题办法的一种分析方法
- 先解决主要矛盾,再解决次要矛盾
综合评价分析法
- 综合评价分析法:是从事物的不同方面的数量特征,运用数学、统计等方法,得出综合水平的一种分析方法
- 将多个指标转换为一个能够反映综合水平的指标,进行分析
- 步骤
- 确定综合评价指标体系
- 收集数据并进行数据标准化处理
- 确定指标体系中各指标的权重
- 对标准化后的指标进行加权求和,计算综合得分
- 根据综合得分对参评对象进行排序,得出结论
结构分解法
- 采用逻辑树方式进行对比分析,它是将问题按项目组或结构进行分层罗列,从最高层开始,并逐步向下扩展,分析项目构成的变化,直至找到问题所在
- 分解原则
- 从大范围到小范围
- MECE
因素分解法
- 因素分解法是把综合性指标分解为各个原始因素,主要用于分析有明确数量关联关系的各因素之间的变动对综合指标变动量的影响程度,从而确定影响指标变化的原因
- 步骤
- 确定指标由哪些因素构成
- 确定各因素与指标的关系
- 测定、分析因素对指标变动的影响方向和程度
- 例:杜邦分解
漏斗图分析法
- 漏斗图是对业务流程最直观的一种表现形式,快速指明业务流程中存在问题的环节
预测分析法
- 预测分析法是根据客观对象的已知信息,运用各种定行和定量的分析理论与方法,对事物未来发展的趋势和水平及逆行判断和推测的一种活动
- 预测分析
- 定量预测
- 数值预测
- 趋势分析
- 时间序列
- 回归分析
- 分类预测
- 决策树
- 逻辑回归
- 神经网络
- 数值预测
- 定性预测
- 德尔菲法
- 主观概率法
- 定量预测
趋势分析法
- 趋势分析法是应用事物时间发展延续性原理来预测事物发展的趋势
- 前提假设:即事物的发展具有一定的连贯性,一定的事物过去随时间而发展变化的趋势,也是今后该事物随时间而发展变化的趋势
- 业务为导向,技术为辅助
高级数据分析法
- 产品研究
- 相关分析、对应分析、判别分析、结合分析
- 品牌研究
- 相关分析、聚类分析、判别分析、因子分析、对应分析
- 价格研究
- 相关分析、PSM价格分析
- 市场细分
- 聚类分析、判别分析、因子分析、对应分析、决策树
- 满意度研究
- 相关分析、回归分析、主成分分析、因子分析、结构方程
- 用户研究
- 相关分析、聚类分析、判别分析、对应分析、Logistic回归、决策树、关联规则
- 预测决策
- 回归分析、决策树、神经网络、时间序列、Logistic回归
分析方法总结
- 现状
- 对比
- 目标
- 时间
- 空间
- 特定
- 对比
- 原因
- 细分
- 结构
- 因素
- 步骤
- 细分
- 预测
- 趋势
数据展现方法
数据展现
- 即用图标说话,也称为数据可视化,是将分析得到的数据结果,用合适的图行或表格形式展现给读者、听众,是分析结果容易被理解与接受
数据展现作用
- 表达形象化
- 突出重点
- 体现专业化
图标类型与作用
- 成分
- 饼图、柱形图、条形图、环形图、树状图
- 分布
- 柱形图、条形图、折线图
- 排序
- 柱形图、条形图、气泡图、组合图
- 趋势
- 条形图、折线图、面积堆积图
- 相关
- 柱形图、条形图、气泡图、组合图
- 多重数据比较
- 雷达图
图标制作五步法
- 确定展现主题
- 选择合适图表
- 选择数据作图
- 数据检查
- 检查是否有效展现主题
图表美化原则
- 简约
- 字体统一:大小、颜色、中文字体、英文字体
- 排版简洁:最大化数据墨水比原则
- 配色协调
图表美化原则-色彩基础
- 色系:同色系(红黄蓝绿等)、无色系(黑白灰)
- 色调:暖色调(红、黄),春冬季使用;冷色调(绿、蓝),夏秋季使用
- 对比色:对比色指两种可以明显区分的色彩,如深色和浅色,冷色和暖色,亮色和暗色,可用于突出主题、内容或表现不同类别等
- 相似色:相似色是指一个颜色在明度上的深浅变化,可用于表现类似、过度
- 邻近色
报告撰写方法
数据分析报告是什么
- 用于分析研究,并得出结论、提出解决方案的一种呈现应用文体
- 一份优秀的数据分析报告,需要有层次明晰的分析框架,并且图文并茂,通俗易懂,能够让读者一目了然
报告结构
- 总分总是经典的报告结构,它主要包括:开篇、正文和结尾三大部分
- 总述
- 分析背景
- 分析目的
- 分析思路
- 分述
- 正文
- 总述
- 总结
- 建议
分析背景撰写要点
- 原则:简明扼要
- 目的
- 帮助分析师梳理、明确分析的原因与意义
- 帮助报告阅读者了解整个分析的背景
- 方法
- 外部环境
- 内部环境
- 点题
分析思路撰写要点
- 原则:一个中心,思想基本原则
- 目的:层次分明、逻辑清晰
- 方法:先框架后细化
- 要素
- 时间
- 结构
分析正文撰写要点
- 金字塔结构
- 主要结论
- 分点
- 论据
- 分点
结论形成过程
- 现状+对比
- 结合业务
结论建议撰写要点
- 原则:结论简明扼要、建议具有可行性
- 目的:清晰明确表达观点
- 方法:总结归纳
常用报告术语
- 现状
- 数据显示...数据同时表明...
- 从图表可以看出...
- 据...报告数据据显示,...
- 显然...,不难发现...
- 基于...,我们判断...
- 研究发现...
- 值得注意的是...
- 综上所述...
- 对比
- 环比、同比增长、下降...
- 相对较好(高)、较差(低)...
- 相比明显增长、略微下滑...
- 数据增幅、降幅达...
- ...进入高速发展期
- 月均增长...
- 与目标的差距主要体现在...
- 离目标进度还有...差距
- 排名前三...的依次为...
- 对比来看...增长不足...后期表现乏力...
- 构成
- 市场占有率达...
- 主要集中在...
- 数据呈...分布
- ...,其中...,主要是...
- 原因
- 数据上涨、下跌的原因如下...
- 主要原因包括:1)...2)...3)...能完成(完不成)
- 主要因...引起
- 趋势
- 从上表、图可以看出、对比数据可得、趋势平缓、回落...
- 数据...呈上升趋势...
- 预测
- 保守预测、估计...
- 如果按照...的速度发展...预计(预估)...能完成(完不成)
- 建议
- 由分析得出,需要改善的地方
- 未来需要优化、扩大的地方如下:...
- 后期应着重...
- 建议一方面...,另一方面...
- 建议...以期达到...目的,提高...改善...缓解...最终...
数据分析三字经
- 学习
- 先了解,后深入;先记录,后记忆;
- 先理论,后实践;先模仿,后创新;
- 方法
- 先思路,后方法;先方法,后工具;
- 先框架,后细化;先思考,后动手;
- 分析
- 先业务,后数据;先假设,后验证;
- 先总体,后局部;先总结,后建议。