随笔分类 -  pandas

-
摘要:""" 将列式数据变成二维交叉形式,便于分析,叫做重塑或者透视 1)经过统计得到多维度指标数据 2)使用unstack实现数据二维透视 3)使用pivot简化透视 4)stack,unstack,pivot的语法 """ import pandas as pd import numpy as np 阅读全文
posted @ 2022-03-08 16:52 aall_blue 阅读(62) 评论(0) 推荐(0) 编辑
摘要:数据转换函数map,apply,applymap # 1)map用于Series值的转换 将股票代码英文转换成中文名字 Series.map(dict) or Series.map(function) 都可以 # 公司股票代码到中文的映射,这里都是小写 dict_company_names = { 阅读全文
posted @ 2022-03-08 16:48 aall_blue 阅读(133) 评论(0) 推荐(0) 编辑
摘要:# 1)Series的分层索引MultiIndex ser = df.groupby(['公司', '日期'])['收盘'].mean() 多维索引中,空白的意思是:使用上面的值 ser.unstack() unstack把二级索引变成列 # 日期 10-1-2019 10-2-2019 10-3- 阅读全文
posted @ 2022-03-08 16:44 aall_blue 阅读(70) 评论(0) 推荐(0) 编辑
摘要:import pandas as pd import numpy as np df = pd.DataFrame({ 'A':['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'], 'B':['one', 'one', 'two', 'th 阅读全文
posted @ 2022-03-08 16:42 aall_blue 阅读(76) 评论(0) 推荐(0) 编辑
摘要:# 需求:将Excel中的任务均等分配给多个人?在Excel中新增一列分配任务的每个人的人名。 # 1)将一个大的Excel等扽拆成多个Excel,使用df.iloc方法,将一个大的dataframe,拆分成多个小的dataframe # 将使用dataframe.to_excel保存每个小Exce 阅读全文
posted @ 2022-03-08 16:34 aall_blue 阅读(158) 评论(0) 推荐(0) 编辑
摘要:Merge合并语法 # 第一个表: df_ratings = pd.read_csv( 'data/ratings.csv', sep=',', engine='python', names='UserID,MovieID,Rating,Timestamp'.split(',') ) # 第二个表: 阅读全文
posted @ 2022-03-08 16:30 aall_blue 阅读(496) 评论(0) 推荐(0) 编辑
摘要:# 1)使用index查询数据 drop==False,列索引还保持在column: df.set_index('userId', inplace=True, drop=False) # DataFrame设置索引,drop=False不删除这一列数据 # 2)使用index的查询方式 查询user 阅读全文
posted @ 2022-03-08 16:20 aall_blue 阅读(45) 评论(0) 推荐(0) 编辑
摘要:排序 # 1)Series排序 df['aqi'].sort_values() # 升序 df['aqi'].sort_values(ascending=False) # 降序 # 2)DataFrame的排序 # 2.1)单列排序: df.sort_values(by='aqi') # 升序 df 阅读全文
posted @ 2022-03-08 16:13 aall_blue 阅读(254) 评论(0) 推荐(0) 编辑
摘要:# 1)读取数据: df = pd.read_excel('file_path', skiprows=2) 跳过2个空行的数据不读取 # 2)检测空值: df.isnull() # 所有检测,对应的df.notnull() 为True说明有值 df['分数'].isnull() # 单列检测 # 3 阅读全文
posted @ 2022-03-06 14:44 aall_blue 阅读(71) 评论(0) 推荐(0) 编辑
摘要:新增修改数据 # 1)新增Series s1 = pd.Series(list(range(4)), name='F') # 2)新增DataFrame的数据 df = df.append({'A':i}, ignore_index=True) # 3)使用concat新增DataFrame数据 p 阅读全文
posted @ 2022-03-06 14:39 aall_blue 阅读(72) 评论(0) 推荐(0) 编辑
摘要:Series import pandas as pd # 1)直接读取列表数据 s1 = pd.Series([1, 'a', 3.3, 66]) s1.index # 查看索引 s1.values # 获取值 # 2)指定索引读取 s2 = pd.Series([1, 'a', 5.2, 44], 阅读全文
posted @ 2022-03-06 14:22 aall_blue 阅读(153) 评论(0) 推荐(0) 编辑
摘要:1)读取输出文件 import pandas as pd # 1)读取csv df = pd.read_csv(path) df.head() # 查看前几行数据 df.shape # 查看数据的形状,返回(行数,列数) df.columns # 查看列名列表 df.index # 查看索引列 df 阅读全文
posted @ 2022-03-06 13:52 aall_blue 阅读(148) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示