数据分析基础知识
1、数据分析是什么
在我们如今这个时代,相信大多数人都能明白数据的重要性,数据就是信息,而数据分析就是可以让我们发挥这些信息功能的重要手段。
2、数据分析能干什么
对于数据分析能干什么其实我们可以简单的举几个例子:
1、淘宝可以观察用户的购买记录、搜索记录以及人们在社交媒体上发布的内容选择商品推荐
2、股票可以根据相应的数据选择买进卖出
3、今日头条可以将数据分析应用到新闻推送排行算法当中
4、爱奇艺可以为用户提供个性化电影推荐服务
其实数据分析不仅可以完成像以上这样的推荐系统,在制药行业也可运用数据分析来预测什么样的化合物更有可能制成高效药物等
所以说数据分析绝对是未来所有公司不可或缺的岗位,目前社会上获取数据方式太多了,这么多的数据,只要我们拥有数据分析的技能,绝对可以应付任何岗位上的工作。
3、为什么利用Python进行数据分析
-
1、Python的代码语法简单易学
-
2、Python可以很容易的整合C、C++等语言的代码
-
3、Python有大量用于科学计算的库
-
4、Python不仅可以用于研究和原型构建,同时也适用于构建生产系统
4、数据分析过程概述
4.1、提出问题
在真正的工作场景下,往往我们需要的处理的是多个庞大的数据集还有可能是类型完全不同的数据,那这个时候一个准确的问题就可以让我们聚集与问题相关的那部分数据,为后续的分析操作提供一个明确的方向,帮助我们得到一个有意义的结论。
4.2、整理数据
整理数据主要分为三步:
(1)、收集数据
通过多种途径拿到数据,导入到Jupyter Notebook
中
(2)、评估数据
这一步主要是需要找出数据是否存在质量或者结构等方面的问题
(3)、清理数据
通过修改、替换、删除等方式保证数据质量高、结构好
3.3、探索性数据分析
在这一步骤主要可以探索并且扩充数据
4.4、得出结论
在进行完探索性数据分析之后肯定会得出一个结果或者说是结论,这样我们就可以根据这样一个结论进行相应的操作,就比如说分析股票数据得到那个大盘趋势好可以选择买进,又或者说类似于万达这样的大型商场可以分析那种类型的商品会比较受用户的欢迎,以便针对性的存货。但是具体的操作可能就需要用到机器学习或者推断统计学来实现,这个就与数据分析不一样了
4.5、传达结果
分析的能力有多强,分析的价值就有多大。
这一步主要是向其他人证明你发现的见解以及传达意义
5.数据分析的编辑工具:
-
ipython
-
pip3 install ipython
-
本质上就是Python命令行的加强版
-
-
jupyter notebook
-
pip3 install jupyter 启动:jupyter notebook
-
安装anaconda软件 包含了jupyter ,numpy,pandas 等200个数据分析包
-
-
pycharm和anaconda就是两个不一样的编辑器。Pycharm 是开发喜欢用的编辑器。而anaconda是数据分析人员喜欢用的编辑器
jupyter notebook快捷键:
命令行模式:鼠标不闪动,单元格颜色变成蓝色
编辑模式:鼠标闪动,单元格颜色绿色
编辑模式切换到命令行模式,按ESC键即可
快捷键使用:
1.运行当前单元格,并选中下一个单元格: shift+enter
2.只是运行当前单元格: crtl+enter
3.在当前单元格的上方添加一个单元格:按esc进入命令行模式,然后按 a(above) 即可
4.在当前单元格的下方添加一个单元格:按esc进入命令行模式,然后按b(below) 即可
5.删除当前的单元格:按esc进入命令行模式,按dd即可
6.代码模式和markdown的切换:按esc进入命令行模式,按M进入markdown模式