电商 Python 访客Excel合并

代码如下

import pandas as pd
import os
import re

path = "./files/"
files = os.listdir(path)


# 用于存放Excel,里面的每个元素类型为:pandas.core.frame.DataFrame
list_excel = []

for filename in files:
    fullname = path + filename# excel的相对路径
    df = pd.read_excel(fullname)# 默认读取Excel的第一个表单
    
    # 访问时间列 增加 日期
    m = re.search("(\d{4}-\d{1,2}-\d{1,2})", filename)   
    strdate = m.group(1)
    df["访问时间"] =['%s %s' % (strdate, s) for s in df["访问时间"]]
    
    col_name = df.columns.tolist()
    if '搜索关键字' not in col_name:
        # 插入列
        index = col_name.index('入店来源') + 1
        col_name.insert(index, '搜索关键字')
        df = df.reindex(columns = col_name)

        # 修改值
        df.loc[df['入店来源'].str.find('手淘搜索') > -1 , '搜索关键字'] = df['入店来源'].str.replace('手淘搜索','')
        df.loc[df['入店来源'].str.find('手淘搜索') > -1 , '入店来源'] = '手淘搜索'

    list_excel.append(df)# 把Excel追加到list中


writer = pd.ExcelWriter('test.xlsx')

# pd.concat:数据拼接
# to_excel:写入到Excel
pd.concat(list_excel).to_excel(writer,'sheet1',index=False)

writer.save()

print('合并完成')


目录结构




合并后的数据预览



posted @ 2020-05-29 14:38  古兴越  阅读(233)  评论(0编辑  收藏  举报