数据分析实战——01丨数据分析全景图及修炼指南
- 当我们谈论数据分析的时候,都在讲些什么呢?
- 数据采集。它是我们的原材料
- 数据挖掘。之所以要进行数据分析,就是要找到其中的规律,来指导我们的业务
- 数据可视化。它可以说是数据领域中万金油的技能,可以让我们直观地了解到数据分析的结果
- 数据采集
- “八爪鱼”这个自动抓取的神器,它可以帮你抓取 99% 的页面源
- 编写 Python 爬虫,自动下载例如“王祖贤”的海报,还能自动给微博加粉丝,让你掌握自动化的快感
- 数据挖掘
- 每讲完一个算法原理,我都会带你做一个项目的实战
- 数据可视化
- 第一种就是使用 Python。在 Python 对数据进行清洗、挖掘的过程中,我们可以使用 Matplotlib、Seaborn 等第三方库进行呈现。
- 第二种就是使用第三方工具。如果你已经生成了 csv 格式文件,想要采用所见即所得的方式进行呈现,可以采用微图、DataV、Data GIF Maker 等第三方工具,它们可以很方便地对数据进行处理,还可以帮你制作呈现的效果。
- 学习数据分析最好的方法是:在工具中灵活运用,在项目中加深理解
- 如果你开始做数据分析的项目,你脑海中已经思考好了数据挖掘的算法模型,请牢记下面这两点原则
- 1. 不重复造轮子
- 一个模型是否有相关的类库可以使用——这几乎是每个程序员入行被告知的第一条准则
- 2. 工具决定效率
- 工程师会选择使用者最多的工具。因为:Bug 少、文档全、案例多
- 如何快速积累这些“资产”呢?这里我送你三个字:熟练度
- 1. 不重复造轮子
- 学习方法
- 记录下你每天的认知
- 这些认知对应工具的哪些操作。用自己的语言记录下这些操作笔记
- 做更多练习来巩固你的认知
- 学习这件事,70%靠实践,20%靠与人交流,10%靠学习理论
行者无疆,始于足下
行走,思考,在路上