随笔分类 -  数据分析:Pandas随记

摘要:Employees表: 对 Full Name 进行切割分列: 部分结果图: 把分隔后的FistName 都变成大写 结果图: 把分隔的LastName都变成小写 结果图: 引申:更多Series.str 方法详见:http://pandas.pydata.org/pandas-docs/versi 阅读全文
posted @ 2019-05-03 01:06 后来的后来123 阅读(10815) 评论(0) 推荐(1) 编辑
摘要:student表: score表: 要求从students表里查出每个学生对应的成绩 结果图: 阅读全文
posted @ 2019-05-03 00:10 后来的后来123 阅读(11789) 评论(0) 推荐(0) 编辑
摘要:Students.xlsx表里的数据如下: 筛选出年龄在18-30岁,且成绩在85分以上的 结果图: 分解下: 一、筛出年龄在18-30岁之间的 结果图: 二、筛出成绩在85分以上的 结果图: 阅读全文
posted @ 2019-05-02 23:18 后来的后来123 阅读(809) 评论(0) 推荐(0) 编辑
摘要:结果图: 阅读全文
posted @ 2019-05-02 22:44 后来的后来123 阅读(8628) 评论(0) 推荐(0) 编辑
摘要:函数填充、计算列 结果图: 一、将"ListPrice"列 和 "Discount"列 相乘的值赋给Price 部分结果图: 二、将"ListPrice"列 +2元 后 赋给Price 部分结果图: 阅读全文
posted @ 2019-05-02 18:50 后来的后来123 阅读(3219) 评论(0) 推荐(0) 编辑
摘要:excel表的数据情况如下:下面数据区域的左边和上边都是空,这会导致我们读取近pathon里时,结构不是我们要的,需要用到skiprow和usecols来控制我们想要读取的区域 整合: 结果图: 分解: 一、为ID列自动填充1-20的数字 : 结果图: 二、给 InStore 列 替换式的填充 YE 阅读全文
posted @ 2019-05-02 17:49 后来的后来123 阅读(7318) 评论(0) 推荐(0) 编辑
摘要:一、更改DataFrame的某些值 1、更改DataFrame中的数据,原理是将这部分数据提取出来,重新赋值为新的数据。 2、需要注意的是,数据更改直接针对DataFrame原数据更改,操作无法撤销,如果做出更改,需要对更改条件做确认或对数据进行备份。 代码: 结果图: 二、插入新增列、行 代码: 阅读全文
posted @ 2019-01-24 20:59 后来的后来123 阅读(315742) 评论(4) 推荐(5) 编辑
摘要:一、删除DataFrame的某列或某行数据 1、删除某列或某行数据可以用到pandas提供的方法drop 2、drop方法的用法:drop(labels, axis=0, level=None, inplace=False, errors='raise') -- axis为0时表示删除行,axis为 阅读全文
posted @ 2019-01-24 20:34 后来的后来123 阅读(126544) 评论(0) 推荐(4) 编辑
摘要:一、DataFrame的数据查询 / 提取 1、对单列、多列进行访问读取 -- 对单列数据的访问:DataFrame的单列数据为一个Series。根据DataFrame的定义可以知晓DataFrame 是一个带有标签的二维数组,每个标签相当每一列的列名;如:df.a df['a'] -- 对多列数据 阅读全文
posted @ 2019-01-24 18:49 后来的后来123 阅读(17726) 评论(0) 推荐(2) 编辑
摘要:一、DataFrame数据的基本属性 代码: 阅读全文
posted @ 2019-01-24 17:08 后来的后来123 阅读(4358) 评论(0) 推荐(1) 编辑
摘要:一、文本文件读取 文本文件是一种由若干行字符构成的计算机文件,它是一种典型的顺序文件。 csv是一种逗号分隔的文件格式,因为其分隔符不一定是逗号,又被称为字符分隔文件,文件以纯文本形式存储表格数据(数字和文本)。 1、使用read_table来读取文本文件:格式:pandas.read_table( 阅读全文
posted @ 2019-01-24 16:36 后来的后来123 阅读(26022) 评论(0) 推荐(0) 编辑
摘要:一、pandas核心数据结构:Series 理解:Series可以理解为一个一维的数组,只是index可以自己改动。类似于定长的有序字典,有Index和value。创建的方法统一为:pd.Series(data,index=) 1)打印的时候按照index赋值的顺序 2)index参数默认从0开始的 阅读全文
posted @ 2019-01-24 14:57 后来的后来123 阅读(2251) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示