Python——提取符号、表格拆分数据(指定分隔符、分列)
目录
1 指定多个分隔符——re.split()
import re
text='3,5.6:6'
print(re.split('[.,:]',text))
输出
['3', '5', '6', '6']
2 表格分列——str.split()
pandas.Series.str.split(pat=None, n=-1, expand=False)
pat表示分隔符,默认以空格分隔;n表示分割次数,默认为 -1,即分隔所有;expand为true,表示会把切割出来的内容当做一列,产生多列,若为False,则把切割后的内容当作一个列表。
3 提取前几个字符
#x[0:2]前二位
df['列名']=df['列名'].apply(lambda x:x[0:2]).tolist()
实例
Login_nei['shengfen'] = Login_nei['login_place'].apply(lambda x:x[2:5]).tolist()
Login_nei['chengshi'] = Login_nei['login_place'].apply(lambda x:x[5:]).tolist()
Login_nei.head()
4 指定分隔符分列
#将日期与时间分割
Login1 = Login["login_time"].str.split(" ",expand=True).fillna("")
Login1['login_data'] = Login1[0]
Login1['login_hour'] = Login1[1]
Login1['user_id'] = Login['user_id']
Login2 = Login1[['user_id','login_data','login_hour']]
Login2.head()