pandas基础
movie.csv
序号,名称 1,21 2,324 3,31 2,312 1,3
代码
import pandas as pd import numpy as np movie = pd.read_csv('data/movie.csv') #用read_csv()方法读取csv文件 movie.head() #head()方法可以查看前五行,head(n)可以查看前n行 movie.shape #数据shape movie2=movie.set_index('序号') #数据shape的行索引设置为'序号' movie2=pd.read_csv('data/movie.csv', index_col='序号') #同上set_index movie2.reset_index() #复原行索引 movie3=movie.rename(index={}, columns={'序号':'ID'}) #重命名行名、列名 columns=movie.columns #获取列索引 columns.values #获取列内容 index=movie.index #获取行索引 index_list=index.tolist() #获取行索引列表 index_list[0]='00' #行索引第一项变为00 movie.index = index_list #更新行索引 movie['new_column'] = 0 #增加新的列,并进行赋值 movie['new_column1']=movie['序号']+movie['名称'] #增加新的列,赋值操作,别的列进行+操作 movie['new_column'].all() # 用all()检查是否所有的布尔值都为True movie.drop('new_column',axis='columns') # 用drop删除行、列数据 name_index=movie.columns.get_loc('名称') + 1 # get_loc获取‘名称’列的位置索引 movie.insert(name_index, column='name_next',value=movie['名称']) # insert插入一列 print(movie) data=movie.values #获取数据 data[0] #获取第一行数据 movie.dtypes #各列数据类型 movie['序号'] #获取'序号'列数据 movie.序号 #获取'序号'列数据 ID=movie['序号'] ID.name #获取'序号'列数据的列名称 ID.to_frame().head() #单列Series转换为DataFrame,返回'序号'列所有数据 s_attr_methods = set(dir(pd.Series)) #获取Series下所有不重复指令 df_attr_methods = set(dir(pd.DataFrame))#获取DataFrame下所有不重复指令 ID.head() #获取'序号'列数据 ID.value_counts() #获取'序号'列数据计数 ID.value_counts().head(3) #获取'序号'列 计数查看前三 ID.value_counts(normalize=True) #获取'序号'列 返回频率 ID.size #获取'序号'列 数据size ID.shape #获取'序号'列 数据shape len(ID) #获取'序号'列 数据长度 ID.count() #获取'序号'列 数据非空数值统计 ID.quantile() #获取'序号'列 数据中位分位数 ID.min() #获取'序号'列 数据最小值 ID.max() #获取'序号'列 数据最大值 ID.mean() #获取'序号'列 数据平均值 ID.median() #获取'序号'列 数据中位数 ID.std() #获取'序号'列 数据标准差 ID.sum() #获取'序号'列 数据总和 ID.describe() #获取'序号'列 打印描述信息 ID.isnull() #获取'序号'列 非空判断 ID.isnull().sum() #获取'序号'列 统计缺失值的数量 ID.isnull().mean() #获取'序号'列 缺失值的比例 ID.fillna(0) #获取'序号'列 填充缺失值 ID.fillna(0).astype(int).head() #获取'序号'列 缺失值填充为0、转换为整型、查看前五 ID.dropna() #获取'序号'列 删除缺失值 ID.hasnans #获取'序号'列 判断是否有缺失值 ID.notnull() #获取'序号'列 判断是否是非缺失值 ID+1 #获取'序号'列 值+1操作 ID>7 #获取'序号'列 判断是否>7 ID==1 #获取'序号'列 判断是否==1 ID.add(1) #获取'序号'列 值+1操作 ID.mul(1) #获取'序号'列 值*1操作 ID.floordiv(7) #获取'序号'列 值//7操作 ID.gt(7) #获取'序号'列 值>7操作 ID.eq(7) #获取'序号'列 值==7操作 ID.mod(5) #获取'序号'列 值%7操作 ID.dtype #获取'序号'列 数据类型
天道酬勤 循序渐进 技压群雄