杨梅冲
每天在想什么呢?

1.数据分析用途

对于数据分析能干什么其实我们可以简单的举几个例子:

1、淘宝可以观察用户的购买记录、搜索记录以及人们在社交媒体上发布的内容选择商品推荐

2、股票可以根据相应的数据选择买进卖出

3、今日头条可以将数据分析应用到新闻推送排行算法当中

4、爱奇艺可以为用户提供个性化电影推荐服务
5.抖音根据你看过的视频来推送短视频 其实数据分析不仅可以完成像以上这样的推荐系统,在制药行业也可运用数据分析来预测什么样的化合物更有可能制成高效药物等 所以说数据分析绝对是未来所有公司不可或缺的岗位,目前社会上获取数据方式太多了,这么多的数据,只要我们拥有数据分析的技能,绝对可以应付任何岗位上的工作。

2.数据分析环节

数据分析环节
1.提出需求
2.收集数据
    公司内部自己的
    爬虫程序爬取的
    花钱直接购买的
3.数据清洗
    缺失数据
    异常数据
    重复数据
    ...
4.数据分析
    数学模型、算法
5.数据可视化
    图标展示
6.数据分析报告撰写

3.常用库分析

Numpy:
Numpy是Numerical Python的简写,主要可以用来做Python数值计算。它提供了多种数据结构、算法以及大部分涉及Python数值计算所需的接口。

快速、高效的多维数组对象ndarray
基于元素的数组计算以及直接对数组执行数学运算的函数
用于读写硬盘上基于数组的数据集的工具
线性代数运算、傅里叶变换,以及随机数生成
用于将C、C++、Fortran代码集成到python的工具

Pandas:
Pandas使我们进行数据分析的一个主要工具。它所包含的数据结构和数据处理工具的设计使得Python中进行数据清洗和分析非常快捷。pandas一般也是和其他数值计算工具一起使用的,支持大部分Numpy语言风格的数组计算。
pandas和numpy最大的区别就是pandas是用来处理表格型或者异质性数据的,而Numpy则刚好相反,它更适合处理同质型的数值类数组数据 matplotlib: matplotlib是最流行的用于绘制数据图表的python库

4.ipython模块

ipython模块(实际工作可以考虑使用)
    1.有命令提示
    2.有行数标识
    3.有颜色区分

# 下载
pip3 install ipython
# 使用
直接cmd窗口输入ipython即可

C:\Users\chun_xiong>ipython
Python 3.8.5 (default, Sep 3 2020, 21:29:08) [MSC v.1916 64 bit (AMD64)]
Type 'copyright', 'credits' or 'license' for more information
IPython 7.19.0 -- An enhanced Interactive Python. Type '?' for help.


In [1]: exit()

5.jupyter模块

# 下载
pip3 install jupyter
# 使用
jupyter notebook
自动调用系统默认浏览器打开界面,再次基础之上如果你使用其他浏览器打开会需要认证
http://localhost:8888/?token=af715181097b39f4173d2b2a5d23de96e9262b96b0c7916c
# 运行python3 生成文件(Untitled.ipynb),后缀名
.ipynb  就是notebook文件

#可以上传本地ipynb文件

6.Anaconda软件

内部集成了数据分析相关的所有功能
并且自动帮你下载了数据分析相关的200多个包(模块)
教程:https://docs.anaconda.com/anaconda/user-guide/getting-started/
# 注意事项:
    如果想让anacond能够正常的运行
    你的计算机名称不能有中文
1.安装完成后需要你现在搜索框中搜索该软件才可以运行
    anacaonda navigator
2.之后你可以制作桌面图标

 

posted on 2021-01-20 15:10  杨梅冲  阅读(164)  评论(0编辑  收藏  举报