pandas基础

movie.csv

序号,名称
1,21
2,324
3,31
2,312
1,3

代码

import pandas as pd
import numpy as np    
movie = pd.read_csv('data/movie.csv')   #用read_csv()方法读取csv文件
movie.head()                            #head()方法可以查看前五行,head(n)可以查看前n行
movie.shape                             #数据shape

movie2=movie.set_index('序号')                          #数据shape的行索引设置为'序号'
movie2=pd.read_csv('data/movie.csv', index_col='序号')  #同上set_index
movie2.reset_index()                                    #复原行索引

movie3=movie.rename(index={}, columns={'序号':'ID'})    #重命名行名、列名

columns=movie.columns                   #获取列索引
columns.values                          #获取列内容
index=movie.index                       #获取行索引
index_list=index.tolist()               #获取行索引列表
index_list[0]='00'                      #行索引第一项变为00
movie.index = index_list                #更新行索引

movie['new_column'] = 0                 #增加新的列,并进行赋值
movie['new_column1']=movie['序号']+movie['名称']    #增加新的列,赋值操作,别的列进行+操作
movie['new_column'].all()               #  用all()检查是否所有的布尔值都为True
movie.drop('new_column',axis='columns') #  用drop删除行、列数据

name_index=movie.columns.get_loc('名称') + 1                        #   get_loc获取‘名称’列的位置索引
movie.insert(name_index, column='name_next',value=movie['名称'])    #   insert插入一列
print(movie)

data=movie.values                       #获取数据
data[0]                                 #获取第一行数据
movie.dtypes                            #各列数据类型

movie['序号']                           #获取'序号'列数据
movie.序号                              #获取'序号'列数据
ID=movie['序号'] 
ID.name                                 #获取'序号'列数据的列名称
ID.to_frame().head()                    #单列Series转换为DataFrame,返回'序号'列所有数据

s_attr_methods = set(dir(pd.Series))    #获取Series下所有不重复指令
df_attr_methods = set(dir(pd.DataFrame))#获取DataFrame下所有不重复指令           

ID.head()                               #获取'序号'列数据
ID.value_counts()                       #获取'序号'列数据计数
ID.value_counts().head(3)               #获取'序号'列 计数查看前三 
ID.value_counts(normalize=True)         #获取'序号'列 返回频率
ID.size                                 #获取'序号'列 数据size
ID.shape                                #获取'序号'列 数据shape
len(ID)                                 #获取'序号'列 数据长度
ID.count()                              #获取'序号'列 数据非空数值统计
ID.quantile()                           #获取'序号'列 数据中位分位数
ID.min()                                #获取'序号'列 数据最小值
ID.max()                                #获取'序号'列 数据最大值   
ID.mean()                               #获取'序号'列 数据平均值
ID.median()                             #获取'序号'列 数据中位数
ID.std()                                #获取'序号'列 数据标准差
ID.sum()                                #获取'序号'列 数据总和
ID.describe()                           #获取'序号'列 打印描述信息

ID.isnull()                             #获取'序号'列 非空判断
ID.isnull().sum()                       #获取'序号'列 统计缺失值的数量
ID.isnull().mean()                      #获取'序号'列 缺失值的比例

ID.fillna(0)                            #获取'序号'列 填充缺失值
ID.fillna(0).astype(int).head()         #获取'序号'列 缺失值填充为0、转换为整型、查看前五

ID.dropna()                             #获取'序号'列 删除缺失值
ID.hasnans                              #获取'序号'列 判断是否有缺失值
ID.notnull()                            #获取'序号'列 判断是否是非缺失值
ID+1                                    #获取'序号'列 值+1操作
ID>7                                    #获取'序号'列 判断是否>7
ID==1                                   #获取'序号'列 判断是否==1
ID.add(1)                               #获取'序号'列 值+1操作 
ID.mul(1)                               #获取'序号'列 值*1操作 
ID.floordiv(7)                          #获取'序号'列 值//7操作 
ID.gt(7)                                #获取'序号'列 值>7操作 
ID.eq(7)                                #获取'序号'列 值==7操作 
ID.mod(5)                               #获取'序号'列 值%7操作 

ID.dtype                                #获取'序号'列 数据类型
posted @ 2022-02-18 16:52  wuyuan2011woaini  阅读(30)  评论(0编辑  收藏  举报