优达学城数据分析师纳米学位——知识点总结2
绘制图形的相关命令
https://campus.datacamp.com/courses/intermediate-python-for-data-science/matplotlib?ex=18
Line plot
导入库 import matplotlib.pyplot as plt
plt.plot() 绘制线形图 plt.hist() 绘制histogram plt.scatter()绘制散点图
plt.show() plt.clf() 绘制多张图形时,打开+关闭命令
Customization
histogram中设定分组数量 bins 变量
plt.text可以添加文本注释 plt.xscale()添加坐标轴 plt.title() plt.xticks()
- Use
tick_val
andtick_lab
as inputs to thexticks()
function to make the the plot more readable - size 命令 调整圆点的大小
- c = col 可以调整气泡颜色 alpha 调整透明度
创建nparray pandas Series
命令unique() argmax() defaultdict() format()字符串格式函数,以函数参数代替{}
loc():Series 索引命令
dropna() :舍弃空值
向量化运算 : 数值运算 逻辑运算 比较运算
https://zhuanlan.zhihu.com/p/25047215 豆瓣水军的问题分析
https://campus.datacamp.com/courses/kaggle-python-tutorial-on-machine-learning/predicting-with-decision-trees?ex=2
datacamp网站的kaggle入门教程