pandas - 随笔分类 - aall_blue

Pandas_stack和pivot实现数据透视

摘要：""" 将列式数据变成二维交叉形式，便于分析，叫做重塑或者透视 1）经过统计得到多维度指标数据 2）使用unstack实现数据二维透视 3）使用pivot简化透视 4）stack，unstack，pivot的语法 """ import pandas as pd import numpy as np 阅读全文

posted @ 2022-03-08 16:52 aall_blue 阅读(62) 评论(0) 推荐(0) 编辑

Pandas_数据转换函数map，apply，applumap

摘要：数据转换函数map，apply，applymap # 1）map用于Series值的转换将股票代码英文转换成中文名字 Series.map(dict) or Series.map(function) 都可以 # 公司股票代码到中文的映射，这里都是小写 dict_company_names = { 阅读全文

posted @ 2022-03-08 16:48 aall_blue 阅读(133) 评论(0) 推荐(0) 编辑

Pandas_分层索引

摘要：# 1）Series的分层索引MultiIndex ser = df.groupby(['公司', '日期'])['收盘'].mean() 多维索引中，空白的意思是：使用上面的值 ser.unstack() unstack把二级索引变成列 # 日期 10-1-2019 10-2-2019 10-3- 阅读全文

posted @ 2022-03-08 16:44 aall_blue 阅读(70) 评论(0) 推荐(0) 编辑

Pandas_groupby分组统计

摘要：import pandas as pd import numpy as np df = pd.DataFrame({ 'A':['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'], 'B':['one', 'one', 'two', 'th 阅读全文

posted @ 2022-03-08 16:42 aall_blue 阅读(76) 评论(0) 推荐(0) 编辑

Pandas_Excel文件的拆分合并

摘要：# 需求：将Excel中的任务均等分配给多个人？在Excel中新增一列分配任务的每个人的人名。 # 1)将一个大的Excel等扽拆成多个Excel，使用df.iloc方法，将一个大的dataframe，拆分成多个小的dataframe # 将使用dataframe.to_excel保存每个小Exce 阅读全文

posted @ 2022-03-08 16:34 aall_blue 阅读(158) 评论(0) 推荐(0) 编辑

Pandas_数据合并+拆分

摘要：Merge合并语法 # 第一个表： df_ratings = pd.read_csv( 'data/ratings.csv', sep=',', engine='python', names='UserID,MovieID,Rating,Timestamp'.split(',') ) # 第二个表：阅读全文

posted @ 2022-03-08 16:30 aall_blue 阅读(496) 评论(0) 推荐(0) 编辑

Pandas_索引

摘要：# 1)使用index查询数据 drop==False，列索引还保持在column： df.set_index('userId', inplace=True, drop=False) # DataFrame设置索引，drop=False不删除这一列数据 # 2）使用index的查询方式查询user 阅读全文

posted @ 2022-03-08 16:20 aall_blue 阅读(45) 评论(0) 推荐(0) 编辑

Pandas_排序+字符串处理

摘要：排序 # 1）Series排序 df['aqi'].sort_values() # 升序 df['aqi'].sort_values(ascending=False) # 降序 # 2)DataFrame的排序 # 2.1)单列排序： df.sort_values(by='aqi') # 升序 df 阅读全文

posted @ 2022-03-08 16:13 aall_blue 阅读(254) 评论(0) 推荐(0) 编辑

Pandas 数据清洗缺失值处理

摘要：# 1）读取数据: df = pd.read_excel('file_path', skiprows=2) 跳过2个空行的数据不读取 # 2）检测空值: df.isnull() # 所有检测,对应的df.notnull() 为True说明有值 df['分数'].isnull() # 单列检测 # 3 阅读全文

posted @ 2022-03-06 14:44 aall_blue 阅读(71) 评论(0) 推荐(0) 编辑

Pandas 新增修改数据 + 数据统计函数 + 根据axis进行删除

摘要：新增修改数据 # 1）新增Series s1 = pd.Series(list(range(4)), name='F') # 2）新增DataFrame的数据 df = df.append({'A':i}, ignore_index=True) # 3）使用concat新增DataFrame数据 p 阅读全文

posted @ 2022-03-06 14:39 aall_blue 阅读(72) 评论(0) 推荐(0) 编辑

Pandas Series+DateFrame数据类型基础操作与 Python中复杂数据类型转换关系

摘要：Series import pandas as pd # 1)直接读取列表数据 s1 = pd.Series([1, 'a', 3.3, 66]) s1.index # 查看索引 s1.values # 获取值 # 2)指定索引读取 s2 = pd.Series([1, 'a', 5.2, 44], 阅读全文

posted @ 2022-03-06 14:22 aall_blue 阅读(153) 评论(0) 推荐(0) 编辑

Pandas 读取输出文件 + 数据查询

摘要：1）读取输出文件 import pandas as pd # 1)读取csv df = pd.read_csv(path) df.head() # 查看前几行数据 df.shape # 查看数据的形状，返回（行数，列数） df.columns # 查看列名列表 df.index # 查看索引列 df 阅读全文

posted @ 2022-03-06 13:52 aall_blue 阅读(148) 评论(0) 推荐(0) 编辑

aall_blue

随笔分类 - pandas

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜