数据分析实战——01丨数据分析全景图及修炼指南

  • 当我们谈论数据分析的时候,都在讲些什么呢?
    • 数据采集。它是我们的原材料
    • 数据挖掘。之所以要进行数据分析,就是要找到其中的规律,来指导我们的业务
    • 数据可视化。它可以说是数据领域中万金油的技能,可以让我们直观地了解到数据分析的结果
  • 数据采集
    • “八爪鱼”这个自动抓取的神器,它可以帮你抓取 99% 的页面源
    • 编写 Python 爬虫,自动下载例如“王祖贤”的海报,还能自动给微博加粉丝,让你掌握自动化的快感
  • 数据挖掘
    • 每讲完一个算法原理,我都会带你做一个项目的实战
  • 数据可视化
    • 第一种就是使用 Python。在 Python 对数据进行清洗、挖掘的过程中,我们可以使用 Matplotlib、Seaborn 等第三方库进行呈现。
    • 第二种就是使用第三方工具。如果你已经生成了 csv 格式文件,想要采用所见即所得的方式进行呈现,可以采用微图、DataV、Data GIF Maker 等第三方工具,它们可以很方便地对数据进行处理,还可以帮你制作呈现的效果。
  • 学习数据分析最好的方法是:在工具中灵活运用,在项目中加深理解
  • 如果你开始做数据分析的项目,你脑海中已经思考好了数据挖掘的算法模型,请牢记下面这两点原则
    • 1. 不重复造轮子
      • 一个模型是否有相关的类库可以使用——这几乎是每个程序员入行被告知的第一条准则
    • 2. 工具决定效率
      • 工程师会选择使用者最多的工具。因为:Bug 少、文档全、案例多
    • 如何快速积累这些“资产”呢?这里我送你三个字:熟练度
  • 学习方法
    • 记录下你每天的认知
    • 这些认知对应工具的哪些操作。用自己的语言记录下这些操作笔记
    • 做更多练习来巩固你的认知
  • 学习这件事,70%靠实践,20%靠与人交流,10%靠学习理论
posted @ 2020-04-23 15:19  怡情养性长智  阅读(429)  评论(0编辑  收藏  举报