随笔分类 -  数据分析

摘要:1、删除重复元素 使用duplicated()函数检测重复的行,返回元素为布尔类型的Series对象,每个元素对应一行,如果该行不是第一次出现,则元素为True - keep参数:指定保留哪一重复的行数据 创建具有重复元素行的DataFrame import pandas as pd from pa 阅读全文
posted @ 2021-01-02 17:20 蜗牛般庄 阅读(2195) 评论(0) 推荐(0) 编辑
摘要:案例分析:美国各州人口数据分析 data-csv: https://cloud.189.cn/t/yuA7BjfMFRzm (访问码:fw18) 需求: 导入文件,查看原始数据 将人口数据和各州简称数据进行合并 将合并的数据中重复的abbreviation列进行删除 查看存在缺失数据的列 找到有哪些 阅读全文
posted @ 2021-01-02 15:47 蜗牛般庄 阅读(445) 评论(0) 推荐(1) 编辑
摘要:pandas的拼接操作 pandas的拼接分为两种: 级联:pd.concat, pd.append 合并:pd.merge, pd.join 1. 使用pd.concat()级联 pandas使用pd.concat函数,与np.concatenate函数类似,只是多了一些参数: objs axis 阅读全文
posted @ 2021-01-02 15:31 蜗牛般庄 阅读(422) 评论(0) 推荐(0) 编辑
摘要:有两种丢失数据: None np.nan(NaN) import pandas as pd import numpy as np from pandas import Series,DataFrame 1. None None是Python自带的,其类型为python object。因此,None不 阅读全文
posted @ 2021-01-02 12:51 蜗牛般庄 阅读(579) 评论(0) 推荐(0) 编辑
摘要:import pandas as pd from pandas import Series,DataFrame import numpy as np 1、Series Series是一种类似与一维数组的对象,由下面两个部分组成: values:一组数据(ndarray类型) index:相关的数据索 阅读全文
posted @ 2020-12-23 11:34 蜗牛般庄 阅读(286) 评论(0) 推荐(0) 编辑
摘要:数据分析: 是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律 数据分析三剑客: Numpy,Pandas,Matplotlib NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大 阅读全文
posted @ 2020-12-22 13:22 蜗牛般庄 阅读(812) 评论(0) 推荐(0) 编辑

Title
页脚 HTML 代码
点击右上角即可分享
微信分享提示