Python——提取符号、表格拆分数据(指定分隔符、分列)

目录

1 指定多个分隔符——re.split()

2 表格分列——str.split()

3 提取前几个字符

4 指定分隔符分列


 

1 指定多个分隔符——re.split()

import re
text='3,5.6:6'
print(re.split('[.,:]',text))

输出 

['3', '5', '6', '6']

2 表格分列——str.split()

pandas.Series.str.split(pat=None, n=-1, expand=False)

pat表示分隔符,默认以空格分隔;n表示分割次数,默认为 -1,即分隔所有;expand为true,表示会把切割出来的内容当做一列,产生多列,若为False,则把切割后的内容当作一个列表。

3 提取前几个字符

 #x[0:2]前二位
df['列名']=df['列名'].apply(lambda x:x[0:2]).tolist()

实例 

Login_nei['shengfen'] = Login_nei['login_place'].apply(lambda x:x[2:5]).tolist()
Login_nei['chengshi'] = Login_nei['login_place'].apply(lambda x:x[5:]).tolist()
Login_nei.head()

4 指定分隔符分列

#将日期与时间分割
Login1 = Login["login_time"].str.split(" ",expand=True).fillna("")
Login1['login_data'] = Login1[0]
Login1['login_hour'] = Login1[1]
Login1['user_id'] = Login['user_id']
Login2 = Login1[['user_id','login_data','login_hour']]
Login2.head()

posted @ 2021-10-15 10:02  小平凡的记录  阅读(125)  评论(0编辑  收藏  举报  来源