<数据分析>数据分析入门
主要目标:学会下面7个方面的知识
预期结果:能写出好的数据分析报告
培养能力:解决问题的能力
0.数据分析的结构层次
1.底层数据的收集/产品端收集(埋点)-----得到原始数据
2.数据业务化/产品需要什么的数据---转化成可理解、可量化、可观察的数据-----加工数据
3.数据可视化/产品的表现如何---对数据指标的监控和衡量---可视化数据/信息 BI
4.数据决策和执行/怎么让产品更好---需要将洞察转换成策略---数据决策
5.数据模型/产品开始自动化和系统化--将策略制作成应用和产品---数据产品和应用
6.数据战略/指导未来---将数据变现做成战略性规划,一直迭代---数据体系/战略
1.1数据思维
1.何为数据分析?
数据分析是指用适当的统计方法对收集来的大量数据进行分析,将它们加以汇总和理解消化,以求最大化地开发数据的功能,发挥数据的作用。
直接的理解:提炼杂乱无章的数据背后的信息,总结出研究对象的内在规律。
2.三种分析思维
结构化---捋顺思路
题目:现在有一个线下销售的产品。我们发现8月的销售额下降,和去年同比下降了20%。
第一层:核心论点
销量
第二层:结构拆解
内部因素:消费者,地区,时间
外部因素:市场竞争,内部容量,政策风险
第三层:MECE--相互独立,完全穷尽
地区:地区A,地区B,地区C
地区A:销售量,销售单价
第四层:验证
结果:
总结:结构化的核心就是思维导图(工具:XMind)---ProcessOn
多人的结构化--头脑风暴(会议上,多人使用)
公式化---将一切都可量化(数据化)
业务化---落地,贴合业务
题目:如何预估上海地区的共享单车投放数量
从城市流动人口计算,从人口密度计算,从城市交通数据计算,从保有自行车计算
思考::自行车的损耗问题---业务化
1.2.数据分析的思维技巧
象限法---直接转化成策略
RFM
多维法
假设法
指数法---衡量的指标
美国最佳NBA球星?怎么衡量
---设置不同权重,Y=K/X,log---很多都靠经验公式
二八法
对比法
漏斗法
怎么锻炼?好奇心
2.业务知识
2、数据分析在企业日常经营中的作用
①现状分析:过去发生了什么
企业的整体运营情况,企业的业务构成
分析一般通过日常通报来完成。
②原因分析
某一现状为什么会发生
一般通过专题分析来完成,针对某一现状进行原因分析。
③预测分析
将来会发生什么
对企业的整体趋势进行预测
一般通过专题分析来完成,通常在企业的季度、年度等计划进行,其开展的频率没有现状分析及原因分析高。
明确分析目的---数据收集---数据处理---数据分析---数据展现----报告撰写
3、数据收集
第一手数据:主要指可直接获取的数据
第二手数据:主要指加工整理后得到的数据
4、需要懂的工具
Excel、Access、SPSS、SAS
5、数据分析与做衣服的对照表
6、常用的理论模型
①PEST分析法
PEST分析法主要用于宏观环境的分析
P(political)政治环境
关键指标:政治体系、经济体制、财政政策、税收政策、产业政策、投资政策、专利数量、国防开支水平、政府补贴水平、民众对政治的参与度等。
E(economic)经济环境
关键指标:GDP及增长率、进出口总额及增长率、利率、汇率、通货膨胀率、消费价格指数、居民可支配收入、失业率、劳动生产率等。
S(social)社会环境
关键指标:人口规模、性别比例、年龄结构、出生率、死亡率、种族结构、妇女生育率、生活方式、购买习惯、教育状况、城市特点、宗教信仰状况等因素。
T(technological)技术环境
关键指标:技术的发明、技术传播、更新。商品化速度、技术发展趋势;国家重点支持项目、国家投入的研发费用、专利个数。
主要对影响企业的外部环境进行分析,这种方法简称PEST分析法
②5W2H分析法
说话抓不住重点→缺乏逻辑训练
5W:何因(Why)、何事(What)、何人(Who)、何时(When)、何地(Where)
2H : 如何做(How)、何价(How much)
③逻辑树分析法(问题树、演绎树、分解树)
将问题所有子问题分层罗列,从最高层开始,并逐步向下扩展。
④4P营销理论
产品(Product)、价格(Price)、渠道(Place)、促销(Promotion)
⑤用户行为理论
一些指标:IP、PV、页面停留时间、跳出率、回访者、新访问者、回访次数、回访相隔天数、流失率、关键字搜索、转化率、登录率等。
行为轨迹:认知---熟悉---试用----使用---忠诚
7.理解数据及数据来源
字段(属性):事物或现象的某种特征。(在统计学中称作变量)
记录:事物或现象某种特征的具体表现。(一行数据)
数据类型
字符型:不具备计算能力的数据
数值型:可以直接使用自然数或计量单位进行计算的数值数据。
一维表:列标签是字段
年份 GDP
二维表:列标签是数据
2016、2017、2018
3.Excel
4.数据可视化
5.SQL
6.统计学
7.python