随笔分类 - 数据分析
摘要:1、删除重复元素 使用duplicated()函数检测重复的行,返回元素为布尔类型的Series对象,每个元素对应一行,如果该行不是第一次出现,则元素为True - keep参数:指定保留哪一重复的行数据 创建具有重复元素行的DataFrame import pandas as pd from pa
阅读全文
摘要:案例分析:美国各州人口数据分析 data-csv: https://cloud.189.cn/t/yuA7BjfMFRzm (访问码:fw18) 需求: 导入文件,查看原始数据 将人口数据和各州简称数据进行合并 将合并的数据中重复的abbreviation列进行删除 查看存在缺失数据的列 找到有哪些
阅读全文
摘要:pandas的拼接操作 pandas的拼接分为两种: 级联:pd.concat, pd.append 合并:pd.merge, pd.join 1. 使用pd.concat()级联 pandas使用pd.concat函数,与np.concatenate函数类似,只是多了一些参数: objs axis
阅读全文
摘要:有两种丢失数据: None np.nan(NaN) import pandas as pd import numpy as np from pandas import Series,DataFrame 1. None None是Python自带的,其类型为python object。因此,None不
阅读全文
摘要:import pandas as pd from pandas import Series,DataFrame import numpy as np 1、Series Series是一种类似与一维数组的对象,由下面两个部分组成: values:一组数据(ndarray类型) index:相关的数据索
阅读全文
摘要:数据分析: 是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律 数据分析三剑客: Numpy,Pandas,Matplotlib NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大
阅读全文