日志文件解析

一,

日志文件,每一行形如:

2.051 NONE - 1.1.1.1 "-" www.example.com /data/small.jpg GET "Tengine<||>-" 404 "-" "Mozilla/5.0 (Windows NT 6.1; rv:37.0) Gecko/20100101 Firefox/37.0" "zh-CN,zh;q=0.5<||>-" "-"

每一行包含十几列,每列由空格隔开。

由于部分列本身可能存在空格,这时该列会用额外的双引号 "" 包含起来。

尝试用自己熟悉的语言,编写一个函数,实现日志解析,提取每一列。

Python 和 C 语言实现最佳,也可提供多个版本(不使用第三方库)。

评价指标

  • 准确性
  • 可读性
  • 防御性编程(容错、健壮性、异常处理)
  • 复杂度、性能

二。代码

 

posted @ 2016-07-25 19:11  DXAndLIGHT  阅读(274)  评论(0编辑  收藏  举报