优达学城数据分析师纳米学位——知识点总结2

绘制图形的相关命令  

https://campus.datacamp.com/courses/intermediate-python-for-data-science/matplotlib?ex=18

Line plot 

导入库 import matplotlib.pyplot as plt

plt.plot() 绘制线形图  plt.hist() 绘制histogram  plt.scatter()绘制散点图 

plt.show() plt.clf() 绘制多张图形时,打开+关闭命令

Customization 

histogram中设定分组数量 bins 变量

plt.text可以添加文本注释 plt.xscale()添加坐标轴 plt.title() plt.xticks() 

 

  • Use tick_val and tick_lab as inputs to the xticks() function to make the the plot more readable 
  • size 命令 调整圆点的大小 
  • c = col 可以调整气泡颜色  alpha 调整透明度

 

创建nparray  pandas Series

命令unique() argmax()  defaultdict() format()字符串格式函数,以函数参数代替{}

loc():Series 索引命令

dropna() :舍弃空值

 

向量化运算 : 数值运算  逻辑运算 比较运算

https://zhuanlan.zhihu.com/p/25047215 豆瓣水军的问题分析 

https://campus.datacamp.com/courses/kaggle-python-tutorial-on-machine-learning/predicting-with-decision-trees?ex=2

datacamp网站的kaggle入门教程

posted @ 2017-01-31 23:50  AugusKong  阅读(958)  评论(0编辑  收藏  举报