Pandas

Pandas

导入

import numpy as np
import pandas as pd

载入数据

相对路径 df=pd.read_csv('' )

绝对路径 df=pd.read_csv(r'' )

逐块读取 chunker=pd.read_csv(‘./文件名’,chunksize=1000)
#每一千个行为一个数据模块 for i in chunker

将表头改为中文

df=pd.read_csv(‘文件名’,names=[ ]) #names中为倒序

改变索引

df=pd.read_csv(‘文件名’,index_col=’ ‘,header=0)

查看数据基本信息

df.info()

观察表格前n行数据

df.head(n)

观察表格后n行数据

df.tail(n)

判断数据是否为空

df.isnull()

保存数据为一个新文件

df.to_csv(‘文件名’)

查看表格数据的每列名称 df.columns()
查看一列所有值 df[‘这列名称‘]或df.这列名称
删除列 del test 1[‘ ‘]
隐藏列 df.drop()
筛选 df[df[‘age’]<10]
显示a的数据中的第n行的b,c a.loc[[n],[‘b’,’c’]]
命名行表头 index=[ ]
命名列表头 columns=[ ]
让列索引降序排列 frame.sort_index(axis=1,ascending=False)
让两列数据同时降序排列 frame.sort_values(by=[‘a’,’c’],ascending=False)

两个dataframe数据相加:结果对应的行和列相加,没有对应的变成空值NaN
Count:样本数据大小
Mean:样本数据平均值
Std:样本数据标准差

posted @   dzhang  阅读(7)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
点击右上角即可分享
微信分享提示