摘要:
EX1 1.使用正则表达式提取出所需信息: df1提取模型的状态,精度和模型名称 df2提取模型训练时间 import pandas as pd df=pd.read_table(r'C:\Users\lxh\Downloads/benchmark.txt', header=None) pat1=' 阅读全文
摘要:
一、时间戳 1. Timestamp的构造和属性 由pd.Timestamp实现,可以通过year, month, day, hour, min, second 可以获取具体的数值: ts = pd.Timestamp('2020-1-1 08:10:30') ts Out[6]: Timestam 阅读全文
摘要:
一、Cat对象 cat对象的属性 使用astype将普通序列转换为分类变量,例如: s = pd.Series(['man','woman','child','man','child']) s = s.astype('category') s Out[49]: 0 man 1 woman 2 chi 阅读全文
摘要:
一、str对象 pandas的str对象将字符串序列化,可以通过[]取出某个位置的元素。 例如,返回的是每个位置的元素,如果缺失返回Nan: import pandas as pd s = pd.Series(['abcd', 'efg', 'hi']) s.str[0] Out[10]: 0 a 阅读全文
摘要:
一、缺失值的统计和删除 统计 使用isna函数,返回值为每个位置是否缺失的逻辑变量。 查看某一列缺失的行,可以根据isna的返回值进行索引,例如: df[df.Height.isna()].head() 如果要查看多个列的情况,可以使用any和all。 例如,isna+all查看三个列同时缺失: s 阅读全文
摘要:
EX1. 数据预处理: 将df2的日期格式转换为年份表示: df2['日期'] = df2['日期'].apply(lambda x:x.split('/')[0]) 将df1的证券代码提取出: df1['证券代码'] = df1['证券代码'].apply(lambda x:int(x[1:-1] 阅读全文
摘要:
一、关系连接 键连接 在 pandas 中的关系型连接函数 merge 和 join 中提供了 how 参数来代表连接形式,分为左连接 left 、右连接 right 、内连接 inner 、外连接 outer 。现有如下两个表格,下面基于这两个表格展示左右连接,内外连接的形式。 df1 = p 阅读全文
摘要:
一、长宽表变形 pivot 将长表变换为宽表,输入有三个参数: index:变形后的行索引 columns:需要转换到列索引的列 values:列和行索引对应的值 例如,先生成一个表: df = pd.DataFrame({'Class':[1,1,2,2], 'Name':['San Zhang' 阅读全文
摘要:
一、分组Groupby 使用方式:df.groupby([分组的依据])[分组的数据] 例如,对不同学校和性别的学生身高分组: df.groupby(['School', 'Gender'])['Height'] **练一练:**请根据上下四分位数分割,将体重分为high、normal、low三组, 阅读全文
摘要:
一、层序遍历 1.使用队列实现 输入根节点,使用队列来遍历。先进的节点会先出去,出去时将自己的子节点放到队列中。 def level(root): if not root: return None queue=[root] res=[] while queue: node = queue.pop(0 阅读全文