摘要: 日志数据分析:1.背景1.1 hm论坛日志,数据分为两部分组成,原来是一个大文件,是56GB;以后每天生成一个文件,大约是150-200MB之间;1.2 日志格式是apache common日志格式;每行记录有5部分组成:访问ip、访问时间、访问资源、访问状态、本次流量;27.19.74.143 - 阅读全文
posted @ 2017-04-11 22:45 ahu-lichang 阅读(5011) 评论(1) 推荐(0) 编辑
摘要: shell编程:对于hadoop程序员,通常需要熟悉shell编程,因为shell可以非常方便的运行程序代码。 1、shell文件格式:xxx.sh #!/bin/sh shell文件第一行必须这么写#井号后面的内容是注释echo 'abcd' echo是输出,回显 在hadoop0:mkdir s 阅读全文
posted @ 2017-04-11 10:53 ahu-lichang 阅读(734) 评论(0) 推荐(0) 编辑
摘要: date命令的帮助信息 [root@localhost source]# date --help用法:date [选项]... [+格式] 或:date [-u|--utc|--universal] [MMDDhhmm[[CC]YY][.ss]]以给定的格式显示当前时间,或是设置系统日期。 -d,- 阅读全文
posted @ 2017-04-11 09:19 ahu-lichang 阅读(270) 评论(0) 推荐(0) 编辑