python解析日志,获取想要的数据
由于老大需要对日志进行解析,获取到相应桩的信息,所以我写了个专门的解析脚本,就是执行的时间有点长,如果用java的话应该可以快2/3.练一下python.
- 在该脚本中遇到的问题就是des解密的时候有一个固定8位的key.当时使用32位的长key,每次都报错,后来发现可以先使用8位空key设置,再setKey(KEY)为32位的.
- 解析截取到的数据时,看似json格式,其实并不是,所以单写了个解析方法.
# -*- coding: utf-8 -*-
import os
import linecache # 对文件进行行缓存,可以直接取到想要的行值
import base64 # base64解码
import pandas as pd # 进行格式化数据
from pyDes import *
from Crypto import Random
import sys
from urllib import parse # 进行urlencode
import time # 记录时间
import json # json转化
FILEDIR = r'E:\aaa'
KEY = '' # 秘钥
PILENUMBERS = ['1011895210701234176-1',
'1011895210701234176-2',
'1011895284617453568-1',
'1011895284617453568-2',
'1011895333984407552-1',
'1011895333984407552-2',
'1011895376523038720-1',
'1011895376523038720-2',
'1011895424895950848-1',
'1011895424895950848-2']
def read_file(filelist):
time = []
cipherText = []
plainText = []
for filename in filelist:
filename = FILEDIR + '\\' + filename
if os.path.exists(filename):
cache_data = linecache.getlines(filename)
for line in range(len(cache_data)):
if r'DES》》Base64后' in cache_data[line]:
str = cache_data[line][len('>DES》》Base64后>'):]
plain = des_decrypt(str)
s2 = analysis(plain)['pileNumber']
if s2 in PILENUMBERS:
time.append(cache_data[line + 3][0:len('2019-03-12 20:13:04')])
cipherText.append(str)
plainText.append(plain)
dataframe = pd.DataFrame({'时间': time, '密文': cipherText, '明文': plainText})
dataframe.to_csv(FILEDIR + '\\' + 'wx.csv', index=False, sep=',', encoding='gbk')
# 获取文件夹下所有的文件
def file_name(filedir):
filelist = os.listdir(filedir)
return filelist
# des解密
def des_decrypt(str):
cipherX = des(key=' ', IV=Random.new().read(8), pad=None, padmode=PAD_PKCS5)
cipherX.setKey(KEY)
b = cipherX.decrypt(base64.b64decode(str))
return parse.unquote(bytes.decode(b)).replace('+', '')
# 解析{uid='61916',terminal='web',id='61916',pileNumber='1011895424895950848-2'}
yuan = r"{uid='61916',terminal='web',id='61916',pileNumber='1011895424895950848-2'}"
def analysis(str):
new_str = '{'
d = str.replace('=', ':')
for i in range(len(d.split(','))):
if '{' in d.split(',')[i].split(':')[0]:
key = "'" + d.split(',')[i].split(':')[0].replace('{', '') + "'"
else:
key = "'" + d.split(',')[i].split(':')[0] + "'"
if '}' in d.split(',')[i].split(':')[1]:
value = d.split(',')[i].split(':')[1].replace('}', '')
else:
value = d.split(',')[i].split(':')[1]
f = key + ':' + value
if 0 < i < len(d.split(',')):
new_str = new_str + ',' + f
elif i == 0:
new_str = new_str + f
return json.loads((new_str + '}').replace("'", '"'))
# print(analysis(yuan)['pileNumber'])
if __name__ == '__main__':
print('开始时间:', time.strftime('%Y.%m.%d %H:%M:%S', time.localtime(time.time())))
read_file(file_name(FILEDIR))
print('结束时间:', time.strftime('%Y.%m.%d %H:%M:%S', time.localtime(time.time())))