Linux定时对日志批量打包Shell脚本及定时任务crontab 详细用法

一、需求背景
     因此次项目的生产环境中部署了多套系统,每天会产生大量的日志(数百GB的量),侵占了服务器宝贵的存储资源空间。为了有效缓解服务器存储压力,考虑通过Linux的Shell脚本结合crontab定时每周一对上周7天的日志打包压缩,并删除原被打包的日志文件,以腾出更多可利用的存储资源空间。

        对于初次接触Shell脚本的同学,建议先花几个小时时间学习一下Shell。附Shell教程链接如下:   

        http://www.runoob.com/linux/linux-shell-process-control.html

二、Shell脚本
进入Linux终端,键入vim timePackLogs.sh(脚本名称)创建脚本并编辑如下脚本代码: 

  1 #!/bin/bash
  2 
  3 #author:haw2106
  4 
  5 #date:20181213
  6 
  7 #department:xxxx
  8 
  9 #email:xxxx@xxxx.com
 10 
 11 #if you have any questions, please contact the email!
 12 
 13 echo `date '+%Y-%m-%d %H:%M:%S'`" 打包程序执行开始!";
 14 
 15 echo "开始打包从7天前截止昨天的日志(如本周日打包上周日到上周六的日志)!";
 16 
 17 #筛选打包日志文件的起始日期
 18 
 19 sevenDaysAgoDate=`date -d "7 days ago" +%Y-%m-%d`
 20 
 21 #筛选打包日志文件的截止日期(此处为获取当前日期)
 22 
 23 currentDate=`date +%Y-%m-%d`
 24 
 25 #起始日期时间戳(作为日期范围对比使用)
 26 
 27 sevenTimeStamp=`date -d "$sevenDaysAgoDate" +%s`
 28 
 29 #截至日期时间戳
 30 
 31 currentTimeStamp=`date -d "$currentDate" +%s`
 32 
 33 index=0
 34 
 35 #日志读取路径
 36 
 37 filePath="/home/weblogic/logs1"
 38 
 39 #获取该路径下所有日志文件
 40 
 41 fileList=`ls $filePath -1 -c`
 42 
 43 #遍历所有日志文件
 44 
 45 for fileName in $fileList
 46 
 47 do
 48 
 49     #将日志文件名及后缀与正则表达式做对比返回yyyy-mm-dd格式的日期值(如2018-09-10)
 50 
 51     fileDate=$( expr "$fileName" : '.*[0−9]{4}\-[0−9]{2}\-[0−9]{2}[0−9]{4}\-[0−9]{2}\-[0−9]{2}.*.*' )    
 52 
 53     #将日期转换为时间戳
 54 
 55     fileDateTimeStamp=`date -d "$fileDate" +%s`
 56 
 57     #当时间戳值不为空且大于等于起始日期小于当前日期,那么获取该日志文件
 58 
 59     if [ "$fileDateTimeStamp" != "" ] && [ $fileDateTimeStamp -ge $sevenTimeStamp ] && [ $fileDateTimeStamp -lt $currentTimeStamp ]
 60 
 61     then
 62 
 63         fileList[$index]="$filePath/$fileName"
 64 
 65     else
 66 
 67         fileList[$index]=""
 68 
 69     fi
 70 
 71     (( index ++ ))
 72 
 73 done
 74 
 75 #获取所有在日期范围内的日志文件, @代表所有
 76 
 77 meetConFiles=${fileList[@]}
 78 
 79 #符合条件的日志文件数大于0就打包压缩
 80 
 81 if [ "${#meetConFiles}" -gt 0 ]
 82 
 83 then
 84 
 85 tar -zcvf $currentDate.tar.gz $meetConFiles
 86 
 87 else
 88 
 89 echo "Not found the meet condition's files!"
 90 
 91 exit 0
 92 
 93 fi
 94 
 95 echo "$currentDate.tar.gz create completion, Now begin to delete old files."
 96 
 97 #删除已被打包压缩的日志文件
 98 
 99 rm -fr $meetConFiles
100 
101 echo "done."
102 
103 exit 0

 

三、配置Crontab文件


 

 

 

注意:

1. CentOS 7的定时任务写在该文件中会报错。需通过crontab -e来设定定时任务

2.上图中为定期每周五执行脚本任务,可根据自身需求进行设置,其中选中行中的weblogic为执行脚本的用户,如果脚本是在root用户下,应输入root,本人的sh脚本是在自身创建的weblogic用户下。

3. MAILTO:接收定时任务邮件的用户名,对于定位定时任务脚本执行产生异常很有帮助。本人的用户名我为weblogic

四、常见问题(执行脚本)
1、permission denied(文件权限不允许)

     为了获得执行权限,切换到sh脚本所在目录,借助chmod指令修改文件权限即可。

     chmod 777 timePackLogs.sh(自身创建的脚本、)

2、本人初次接触Shell脚本开发该功能时,主要在正则表达式方面花了较多时间,建议同学多花些时间学习了解下Shell的正则表      达式。

3、查看crontab的日志记录定位定时任务问题

     当定时执行脚本发生异常时,可通过定时任务的日志来定位问题

     Linux

            a.查阅文件 /var/log/cron,可以用tail -f /var/log/cron观察(普通用户无法查看,需root超管用户)

          b.在 /var/spool/mail/root 文件中,有crontab执行日志的记录,用tail -f /var/spool/mail/root 即可查看最近的crontab执行情况。(root为用户名,本人定时任务脚本生成的日志在weblogic下,所以为/var/spool/mail/weblogic中)

五、crontab -e 与 直接编辑 /etc/crontab 的区别

Linux配置定时任务,大家都知道使用crontab这个系统功能,但有时候我们需要区分用户执行,下面就直接说一下2种方法的区别:

方法1:

使用命令 crontab -e 然后直接编辑定时脚本。

这样执行以后,属于用户自定义的,会被写到 /var/spool/cron 目录下,生成一个和用户名一致的文件,文件内容就是我们编辑的定时脚本。

如:

1 [root@localhost cron.d]# cd /var/spool/cron  
2 [root@localhost cron]# ll  
3 总用量 4  
4 -rw-------. 1 root root 52 12月  9 10:58 root  
5 [root@localhost cron]# pwd  
6 /var/spool/cron  
7 [root@localhost cron]# cat root   
8 30 03 * * * /root/automysqlbackup.sh  

方法2:

使用命令 vi /etc/crontab 编辑定时脚本。

如:

 1 [root@localhost ~]# cat /etc/crontab                                                                                                                                                                      
 2 SHELL=/bin/bash                                                                                                                                                                                           
 3 PATH=/sbin:/bin:/usr/sbin:/usr/bin                                                                                                                                                                        
 4 MAILTO=root                                                                                                                                                                                               
 5 HOME=/                                                                                                                                                                                                    
 6                                                                                                                                                                                                           
 7 # run-parts                                                                                                                                                                                               
 8 30 * * * * root /usr/sbin/ntpdate 210.72.145.44                                                                                                                                                           
 9 #30 8 * * * root /usr/sbin/ntpdate 132.228.90.101                                                                                                                                                         
10 01 * * * * root run-parts /etc/cron.hourly                                                                                                                                                                
11 02 4 * * * root run-parts /etc/cron.daily                                                                                                                                                                 
12 22 4 * * 0 root run-parts /etc/cron.weekly                                                                                                                                                                
13 42 4 1 * * root run-parts /etc/cron.monthly                                                                                                                                                               
14 */1 * * * * root run-parts /opt/openoffice.org3/program/start.sh                                                                                                                                          
15 ############################################                                                                                                                                                              
16                                                                                                                                                                                                           
17 30 4 * * * root /usr/bin/rsync -vzrtopg --progress --delete root@192.168.231.35::resource /hyy/bak/resource 
18 30 4 * * * root /usr/bin/rsync -vzrtopg --progress --delete root@192.168.231.35::log /hyy/bak/log
19 ############################################
20 [root@localhost ~]# 

 

(系统级的)做系统级配置我们会直接配置 /etc/crontab

(用户级的)一般还是建议大家使用 crontab -e ,这样系统也会帮着检查我们配置的脚本语法。

六、crontab 详细用法 定时任务

使用crontab你可以在指定的时间执行一个shell脚本或者一系列Linux命令。例如系统管理员安排一个备份任务使其每天都运行

如何往 cron 中添加一个作业?

# crontab –e
0 5 * * * /root/bin/backup.sh

这将会在每天早上5点运行 /root/bin/backup.sh

Cron 各项的描述

以下是 crontab 文件的格式:

{minute} {hour} {day-of-month} {month} {day-of-week} {full-path-to-shell-script} 
o minute: 区间为 0 – 59 
o hour: 区间为0 – 23 
o day-of-month: 区间为0 – 31 
o month: 区间为1 – 12. 1 是1月. 12是12月. 
o Day-of-week: 区间为0 – 7. 周日可以是0或7.

Crontab 示例

1. 在 12:01 a.m 运行,即每天凌晨过一分钟。这是一个恰当的进行备份的时间,因为此时系统负载不大。

1 0 * * * /root/bin/backup.sh

2. 每个工作日(Mon – Fri) 11:59 p.m 都进行备份作业。

59 11 * * 1,2,3,4,5 /root/bin/backup.sh

下面例子与上面的例子效果一样:

59 11 * * 1-5 /root/bin/backup.sh

3. 每5分钟运行一次命令

*/5 * * * * /root/bin/check-status.sh

4. 每个月的第一天 1:10 p.m 运行

10 13 1 * * /root/bin/full-backup.sh

5. 每个工作日 11 p.m 运行。

0 23 * * 1-5 /root/bin/incremental-backup.sh

Crontab 选项

以下是 crontab 的有效选项:

o crontab –e : 修改 crontab 文件. 如果文件不存在会自动创建。 
o crontab –l : 显示 crontab 文件。 
o crontab -r : 删除 crontab 文件。
o crontab -ir : 删除 crontab 文件前提醒用户。

以上就是crontab命令的具体使用方法了。

 

在linux平台上如果需要实现任务调度功能可以编写cron脚本来实现。
以某一频率执行任务
linux缺省会启动crond进程,crond进程不需要用户启动、关闭。
crond进程负责读取调度任务并执行,用户只需要将相应的调度脚本写入cron的调度配置文件中。
cron的调度文件有以下几个:

   1. crontab
   2. cron.d
   3. cron.daily
   4. cron.hourly
   5. cron.monthly
   6. cron.weekly 

如果用的任务不是以hourly monthly weekly方式执行,则可以将相应的crontab写入到crontab 或cron.d目录中。
示例:
每隔一分钟执行一次脚本 /opt/bin/test-cron.sh
可以在cron.d新建脚本 echo-date.sh
内容为
*/1 * * * * root  /opt/bin/test-cron.sh
在指定的时间运行任务
也可以通过at命令来控制在指定的时间运行任务
如:
at -f test-cron.sh -v 10:25
其中-f 指定脚本文件, -v 指定运行时间
quote:ea946d690b="lophyxp"]首先用
contab -l >contabs.tmp
导出contab的配置。
然后编辑contabs.tmp文件。以一下格式添加一行:
分钟 小时 天 月 星期 命令
比如
10 3 * * 0,6 hello
就是每周六、周日的3点10分执行hello程序。
15 4 * * 4-6 hello
就是从周四到周六的4点15点执行hello程序。
然后用
contab contabs.tmp
命令导入新的配置。
一般不建议直接修改/etc/下的相关配置文件。
启动cron进程的方法:/etc/init.d/crond start
开机就启动cron进程的设置命令:chkconfig --add crond
方法二:
把cron加入到启动脚本中:
# rc-update add vixie-cron default
crontab -l #查看你的任务
crontab-e#编辑你的任务
crontab-r#删除用户的crontab的内容
实例讲解二:
系统cron设定:/etc/crontab
    通过 /etc/crontab 文件,可以设定系统定期执行的任务,当然,要想编辑这个文件,得有root权限
0 7   *    *   *    root    mpg123 ~/wakeup.mp3
分 时 日 月 周
示例:
0 4  * * 0     root emerge --sync && emerge -uD world              #每周日凌晨4点,更新系统
0 2 1 * *     root   rm -f /tmp/*                                                    #每月1号凌晨2点,清理/tmp下的文件
0 8 6 5 *   root     mail  robin < /home/galeki/happy.txt             #每年5月6日给robin发信祝他生日快乐
假如,我想每隔2分钟就要执行某个命令,或者我想在每天的6点、12点、18点执行命令,诸如此类的周期,可以通过 “ / ” 和 “ , ” 来设置:
*/2   *   *   *   *           root      ...............      #每两分钟就执行........
0 6,12,18   *   *   *    root      ...............      #每天6点、12点、18点执行........
每两个小时
0 */2 * * * echo "have a break now." >> /tmp/test.txt
晚上11点到早上8点之间每两个小时,早上八点
0 23-7/2,8 * * * echo "have a good dream:)" >> /tmp/test.txt
每个月的4号与每个礼拜的礼拜一到礼拜三的早上11点
0 11 4 * 1-3 command line
1月1日早上4点
0 4 1 1 * command line
收获:可以把经常要做的一些事放到其中,简化工作量,如每周一检查服务器的运行状态,查看报告,杀掉一些进程等等……


*  *  *  *  *  command
分 时 日 月 周 命令
第1列表示分钟1~59 每分钟用*或者 */1表示
第2列表示小时1~23(0表示0点)
第3列表示日期1~31
第4列表示月份1~12
第5列标识号星期0~6(0表示星期天)
第6列要运行的命令
crontab文件的一些例子:
30 21 * * * /usr/local/etc/rc.d/lighttpd restart
上面的例子表示每晚的21:30重启apache。
45 4 1,10,22 * * /usr/local/etc/rc.d/lighttpd restart
上面的例子表示每月1、10、22日的4 : 45重启apache。
10 1 * * 6,0 /usr/local/etc/rc.d/lighttpd restart
上面的例子表示每周六、周日的1 : 10重启apache。
0,30 18-23 * * * /usr/local/etc/rc.d/lighttpd restart
上面的例子表示在每天18 : 00至23 : 00之间每隔30分钟重启apache。
0 23 * * 6 /usr/local/etc/rc.d/lighttpd restart
上面的例子表示每星期六的11 : 00 pm重启apache。
* */1 * * * /usr/local/etc/rc.d/lighttpd restart
每一小时重启apache
* 23-7/1 * * * /usr/local/etc/rc.d/lighttpd restart
晚上11点到早上7点之间,每隔一小时重启apache
0 11 4 * mon-wed /usr/local/etc/rc.d/lighttpd restart
每月的4号与每周一到周三的11点重启apache
0 4 1 jan * /usr/local/etc/rc.d/lighttpd restart
一月一号的4点重启apache
名称 : crontab
使用权限 : 所有使用者
使用方式 :
crontab file [-u user]-用指定的文件替代目前的crontab。
crontab-[-u user]-用标准输入替代目前的crontab.
crontab-1[user]-列出用户目前的crontab.
crontab-e[user]-编辑用户目前的crontab.
crontab-d[user]-删除用户目前的crontab.
crontab-c dir- 指定crontab的目录。
crontab文件的格式:M H D m d cmd.
M: 分钟(0-59)。
H:小时(0-23)。
D:天(1-31)。
m: 月(1-12)。
d: 一星期内的天(0~6,0为星期天)。
cmd要运行的程序,程序被送入sh执行,这个shell只有USER,HOME,SHELL这三个环境变量
说明 :
crontab 是用来让使用者在固定时间或固定间隔执行程序之用,换句话说,也就是类似使用者的时程表。-u user 是指设定指定
user 的时程表,这个前提是你必须要有其权限(比如说是 root)才能够指定他人的时程表。如果不使用 -u user 的话,就是表示设
定自己的时程表。
参数 :
crontab -e : 执行文字编辑器来设定时程表,内定的文字编辑器是 VI,如果你想用别的文字编辑器,则请先设定 VISUAL 环境变数
来指定使用那个文字编辑器(比如说 setenv VISUAL joe)
crontab -r : 删除目前的时程表
crontab -l : 列出目前的时程表
crontab file [-u user]-用指定的文件替代目前的crontab。
时程表的格式如下 :
f1 f2 f3 f4 f5 program
其中 f1 是表示分钟,f2 表示小时,f3 表示一个月份中的第几日,f4 表示月份,f5 表示一个星期中的第几天。program 表示要执
行的程序。
当 f1 为 * 时表示每分钟都要执行 program,f2 为 * 时表示每小时都要执行程序,其馀类推
当 f1 为 a-b 时表示从第 a 分钟到第 b 分钟这段时间内要执行,f2 为 a-b 时表示从第 a 到第 b 小时都要执行,其馀类推
当 f1 为 */n 时表示每 n 分钟个时间间隔执行一次,f2 为 */n 表示每 n 小时个时间间隔执行一次,其馀类推
当 f1 为 a, b, c,... 时表示第 a, b, c,... 分钟要执行,f2 为 a, b, c,... 时表示第 a, b, c...个小时要执行,其馀类推
使用者也可以将所有的设定先存放在档案 file 中,用 crontab file 的方式来设定时程表。
例子 :
#每天早上7点执行一次 /bin/ls :
0 7 * * * /bin/ls
在 12 月内, 每天的早上 6 点到 12 点中,每隔3个小时执行一次 /usr/bin/backup :
0 6-12/3 * 12 * /usr/bin/backup
周一到周五每天下午 5:00 寄一封信给 alex@domain.name :
0 17 * * 1-5 mail -s "hi" alex@domain.name < /tmp/maildata
每月每天的午夜 0 点 20 分, 2 点 20 分, 4 点 20 分....执行 echo "haha"
20 0-23/2 * * * echo "haha"
注意 :
当程序在你所指定的时间执行后,系统会寄一封信给你,显示该程序执行的内容,若是你不希望收到这样的信,请在每一行空一格之
后加上 > /dev/null 2>&1 即可
例子2 :
#每天早上6点10分
10 6 * * * date
#每两个小时
0 */2 * * * date
#晚上11点到早上8点之间每两个小时,早上8点
0 23-7/2,8 * * * date
#每个月的4号和每个礼拜的礼拜一到礼拜三的早上11点
0 11 4 * mon-wed date
#1月份日早上4点
0 4 1 jan * date
范例
$crontab -l 列出用户目前的crontab.

posted @ 2018-12-13 20:39  haw2106  阅读(3885)  评论(2编辑  收藏  举报