《谁说菜鸟不会数据分析》读书笔记(1)
1.数据分析是什么?
数据分析是指适当的统计分析方法对收集来的大量数据进行分析, 将他们加以汇总, 理解消化, 以求最大地开发数据的功能, 发挥数据的作用. 未来提取有用信息和形成结论而对数据加以详细研究和概括总结的过程. 目的就是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来, 总结出研究对象的内在规律 , 帮助管理者决策判断, 以便采取适当的策略和行动
2.数据分析流程:
明确目标需求->数据收集->数据处理->数据分析->数据呈现->报告撰写
3.常用指标术语:
- 平均数
- 代表总体的一般水平,掩盖了总体内各单位的差异
- 绝对与相对数
- 绝对数:反映总规律
- 相对数:反映现象之间数量联系程度的程度
- 百分比与百分点
- 百分点:不同时期以百分数的形式表示的相对指标的变动幅度
- 频数与频率
- 频数:一组数据中个别数据重复出现的次数(绝对数)
- 频率:每组类别次数与总次数的比值,代表某类别占总体出现的频繁程度。
- 比例与比率
- 比例:总体中各部分的数值占全部数值的比重,反映总体的个构成和结构
- 比率:不同类别数值的对比,反映整体中各部分之间的关系
- 倍数与番数
- 倍数:C=A/B一个数除以另一个数的商,表示数量的增长或者上升幅度
- 番数:原来雨量的2n次倍
- 同比与环比
- 同比:历史同时期进行比较,反映事物发展的相对情况。相差是周期
- 环比:指一个统计期进行比较,反映事物逐期发展的情况。相差是1
4.数据处理:
Excel 快捷键 :
- Ctrl + → 跳到数据区域最右边 , 以空值为界, 其他箭头同理
- Crtl + shift + 箭头 连续选数据区域 , ....
4.1重复值处理
①利用计数函数countif()
②筛选方式取出唯一值
③条件格式(也可以设置其他规则)
④直接使用 [删除重复值] 选项卡
4.2缺失值处理
①定位输入 快捷键: ctrl+G
ctrl+enter 对条件定位数据进行填充
②查找替换 快捷键 : crtl+H
③通配符模糊查找
- * 代表任意几个字符
- ? 代表一个字符
注意: 勾选单元格匹配 , 会找出包含查找内容 , 如果不包括则会把公式里面包含查找内容找出来
4.3逻辑错误检测
①if函数
②条件格式
4.4 公式审核
【公式求值】项 可以分步查看公式计算值
4.5 公式中错误标识
#### | 数值太长,公式太长,单元格显示不下 |
#DIV/0! | 零为除数 |
#N/A | 函数/公式没有可以用的数值 |
#NAME? | 不能识别文本 |
#NULL | 空 |
#NUM! | 数值有问题 |
#REF | 单元格引用无效 |
#VALUE | 数据类型错误 |
5 数据加工
5.1 字段分列
菜单法: 数据->分列->分列依据
函数法: left() right()
5.2 字段合并
concatenate()
5.3 字段匹配
vlookup()
5.4 数据分组
利用vlookup()进行分组
5.5 数据转换
转置:
- 选择性粘贴
数据复制:
- 四向箭头 Crtl + 鼠标左键
- 四向箭头 + 鼠标右键
- ctrl + c/V
5.6 数据抽样