摘要:
文章来自https://blog.csdn.net/qq_33120943/article/details/76569756 详细教程可以查看官方额示例:http://seaborn.pydata.org/examples/index.html 阅读全文
摘要:
前面所介绍的都是以表格的形式中展现数据, 下面将介绍Pandas与Matplotlib配合绘制出折线图, 散点图, 饼图, 柱形图, 直方图等五大基本图形. Matplotlib是python中的一个2D图形库, 它能以各种硬拷贝的格式和跨平台的交互式环境生成高质量的图形, 比如说柱状图, 功率谱, 阅读全文
摘要:
import pandas as pd df_train,df_test = pd.read_csv("F:/Python CODE/Kaggle_Titanic/train.csv"),pd.read_csv("F:/Python CODE/Kaggle_Titanic/test.csv") im 阅读全文
摘要:
13. 简单计算 新建一个数据表df 13.1 加法计算 有两种方式, 一种是利用add()函数: a.add(b) 表示a与b之和, 另一种是直接利用加法运算符号"+" 两者运算的结果都是相同的: 对于累加求和上述两种方法同样适用, 还有一种方式就是采用apply()函数, 参考文档: https 阅读全文
摘要:
1. 重复值的处理 利用drop_duplicates()函数删除数据表中重复多余的记录, 比如删除重复多余的ID. 2. 缺失值的处理 缺失值是数据中因缺少信息而造成的数据聚类, 分组, 截断等 2.1 缺失值产生的原因 主要原因可以分为两种: 人为原因和机械原因. 1) 人为原因: 由于人的主观 阅读全文