摘要: 文章来自https://blog.csdn.net/qq_33120943/article/details/76569756 详细教程可以查看官方额示例:http://seaborn.pydata.org/examples/index.html 阅读全文
posted @ 2018-11-26 15:58 USTC丶ZCC 阅读(140) 评论(0) 推荐(0) 编辑
摘要: 前面所介绍的都是以表格的形式中展现数据, 下面将介绍Pandas与Matplotlib配合绘制出折线图, 散点图, 饼图, 柱形图, 直方图等五大基本图形. Matplotlib是python中的一个2D图形库, 它能以各种硬拷贝的格式和跨平台的交互式环境生成高质量的图形, 比如说柱状图, 功率谱, 阅读全文
posted @ 2018-11-26 10:26 USTC丶ZCC 阅读(14097) 评论(0) 推荐(0) 编辑
摘要: import pandas as pd df_train,df_test = pd.read_csv("F:/Python CODE/Kaggle_Titanic/train.csv"),pd.read_csv("F:/Python CODE/Kaggle_Titanic/test.csv") im 阅读全文
posted @ 2018-11-26 10:05 USTC丶ZCC 阅读(520) 评论(0) 推荐(0) 编辑
摘要: 13. 简单计算 新建一个数据表df 13.1 加法计算 有两种方式, 一种是利用add()函数: a.add(b) 表示a与b之和, 另一种是直接利用加法运算符号"+" 两者运算的结果都是相同的: 对于累加求和上述两种方法同样适用, 还有一种方式就是采用apply()函数, 参考文档: https 阅读全文
posted @ 2018-11-26 09:55 USTC丶ZCC 阅读(343) 评论(0) 推荐(0) 编辑
摘要: 1. 重复值的处理 利用drop_duplicates()函数删除数据表中重复多余的记录, 比如删除重复多余的ID. 2. 缺失值的处理 缺失值是数据中因缺少信息而造成的数据聚类, 分组, 截断等 2.1 缺失值产生的原因 主要原因可以分为两种: 人为原因和机械原因. 1) 人为原因: 由于人的主观 阅读全文
posted @ 2018-11-26 09:52 USTC丶ZCC 阅读(405) 评论(0) 推荐(0) 编辑