数据分析
1 数据分析的含义与目标
方法:统计分析方法
目标:提取有用信息,为决策和产品定位起到辅助作用
研究、概括、总结
2 Python与数据分析
Python是数据分析的良好工具
Python特点:
简介 开发效率高 运算速度慢 胶水特性(很好的集成c语言,变相提高运算速度)
数据分析涉及的python模块:
numpy、scipy、matplotlib、pandas、scikit-learn、keras
3 Python数据分析模块们
numpy:可以存储处理大型矩阵,比python中的嵌套列表要高效,numpy定义了数据结构基础
scipy:对numpy功能的补充,提供了强大的科学计算方法(矩阵分析、信号分析、数理分析等)
matplotlib:可视化套件,可用于作图(柱状图、折线图、饼图、三维图等)
pandas:基础的数据分析套件,提供了表级的数据分析,交叉分析、假设检验等
scikit-learn:数据分析建模库(在数据挖掘中起到强大作用),聚类分析、回归分析
keras:人工神经网络
4 Python环境搭建
科学计算工具:Anaconda
下载可选Python3.X版本或者2.7版本,这个Python版本与本地Python版本无关
Windows:
安装完毕后需要与Pychram进行配置,方可使用
File->Default Settings->Project Interpreter
选择 .../anaconda3/bin/python
liunx:
安装:bash Anaconda2-4.2.0-linux-x86_64.sh