数据分析的概念

# 什么是数据分析
  就是从现有的数据中挖掘出价值

# 数据分析应用领域
商品推荐
  eg:在淘宝上搜索了一款产品之后 接下来就会疯狂给你推荐相关产品
量化交易
  股票 期货 等数据分析
短视频推送
  抖音 今日头条等短视频推荐

"""
数据分析绝对是未来所有公司不可或缺的岗位,目前社会上获取数据方式太多了,这么多的数据,只要我们拥有数据分析的技能,绝对可以应付任何岗位上的工作
"""

# 为什么数据分析需要学python
  python简单易学 并且是数据分析必备的语言

数据分析的工作流程

# 以下工作流程是一般情况下常见流程 也有可能会出现偏差
1.需求分析
  搞明白到底要分析什么数据 以什么方式分析 想要什么样的结果

2.数据采集
  数据的来源:
    1.公司内部自带
      直接调用即可 MySQL MongoDB
    2.网络爬虫获取
      需要编写代码 爬虫相关技能
    3.第三方服务
      花钱直接购买 钞能力

3.数据清洗
  针对获取到的数据还需要校验是否符合分析条件
    缺失数据 异常数据...

4.数据分析
  选择相应的计算公式 算法模型分析数据

5.生成数据分析报告
  攥写分析报告并给出分析之后的规律及建议

6.数据可视化
  将复杂的数据用图标的形式展示出来 便于查看相应规律
  数据可视化一般是结合数据分析报告一起

数据分析三剑客简介

numpy

数学计算模块  该模块是很多计算模块的底层模块

pandas

数据分析最为核心的模块之一 主要用于操作excel表格

    """

    既然excel软件可以非常轻松快捷的操作表格数据为什么还需要学pandas

    当表格的数据低于10万行的时候采取excel软件操作方便

    但是数据高于10万行之后使用excel软件就会出现卡顿不方便

   所以pandas模块能够解决数据量较大的情况下的处理操作

    """

matplotlib

数据可视化 

numpy数学计算模块  该模块是很多计算模块的底层模块pandas数据分析最为核心的模块之一 主要用于操作excel表格    """    既然excel软件可以非常轻松快捷的操作表格数据为什么还需要学pandas    当表格的数据低于10万行的时候采取excel软件操作方便    但是数据高于10万行之后使用excel软件就会出现卡顿不方便   所以pandas模块能够解决数据量较大的情况下的处理操作    """matplotlib数据可视化