数据分析师---目录(待补充)

基础知识

数值类型
序列(list,tuple,str),通用技巧和核心基本技巧
dist,常用操作,访问及遍历
条件循环语句和条件语句
自定义函数
局部变量和全局变量
匿名函数lambda
模块创建及import指令运用,pip管理工具

文件对象申明及其操作
系统模块下路径操作
文件读写
pickle模块运用及存储结构化数据


 

工具

numpy基础数据结构
通用函数
索引及切片
随机数
数据输入和输出(存储处理矩阵结构理解数组对象array)

Pandas
数据结构series,基本概念和创建
Series 索引
series基本技巧
Dataframe 基本概念和创建
索引
基本技巧
时间模块
时刻数据
时间戳索引
数值计算和统计基础
文本数据
合并
链接和修补
去重和替换
数据分组
分组转换及拆分-应用-合并
透视表及交叉表
文件读取

Matplotlib
图表窗口
图表的基本元素
图表的样式参数
刻度、注释、图表输出胡
子图
基本表绘制
柱状图、堆叠图、面积图、填图、饼图
直方图、散点图、矩阵散点图
极坐标、箱型图
表格样式创建、显示控制、样式调用

国内外公开数据库介绍


统计学知识

特征分析:
分布分析
对比分析
统计分析
帕累托分析
正态性检验
相关性分析

数据处理: 缺失值处理
异常值处理
数据归一化
数据连续属性离散化

数学建模:
线性回归理论
线性回归Python实现
线性回归模型评估
KNN最邻近分类
KNNpython实现
PCA主成分分析及实现
Kmeans聚类概述即实现
蒙塔卡罗模拟尼伦概述解毒


结果输出

数据可视化技能体系及其方向
数据图表表达的逻辑原理

python-seaborn 数据可视化
调色盘
分布数据可视化:直方图和密度图
散点图
分类散点图
分布图
统计图
线性数据可视化:
时间线图、热图
结构化图表可视化

关系网络数据可视化
gephi软件安装和配置
python数据预处理
案例分析:公司职员关系图表

空间可视化
3D图表
空间柱状图
空间线性轨迹图
空间热力图

python交互图表可视化:bokeh
绘图空间基本操作
图表辅助参数设置
散点图
折线图、面积图
柱状图、堆叠图、直方图
toolbar工具栏设置

 

posted on 2019-01-01 23:27  椰汁黑糯米  阅读(194)  评论(0编辑  收藏  举报

导航