Linux 笔记 - 第十三章 Linux 系统日常管理之(三)Linux 系统日志和服务

博客地址:http://www.moonxy.com

一、前言

日志文件记录了系统每天发生的各种各样的事情,比如监测系统状况、排查问题等。作为系统运维人员可以通过日志来检查错误发生的原因,或者受到攻击时攻击者留下的痕迹。日志的主要功能是审计和监测,还可以实时地监测系统状态、监测和追踪侵入者等等。

二、系统日志文件

Linux日志文件绝大多数存放在 /var/log 目录,其中一些日志文件由应用程序创建,其他的则通过 syslog 来创建。

一般情况下,只需要关注核心的系统和应用程序日志。

例如:

全局系统活动信息等

基于 Debian 的系统,如 Ubuntu 在 /var/log/syslog 中存储。

基于 RedHat 的系统,如 RHEL 或 CentOS 在 /var/log/messages 中存储。

验证和授权信息等

Ubuntu 在 /var/log/auth.log 中存储

RedHat 和 CentOS 在 /var/log/secure 中存储。

2.1 /var/log/messages

日志文件 /var/log/messages 是核心系统日志文件,包含了系统启动时的引导消息,以及系统运行时的其他状态消息。I/O 错误、网络错误和其他系统错误都会记录到这个文件中。还有某个人的身份切换为 root 以及用户自定义安装的软件(Apache)的日志也会出现在此文件中。/var/log/messages 日志文件由 rsyslogd 这个守护进程产生,rsyslog 服务的配置文件为 /etc/rsyslog.conf,这个文件定义了日志的级别。

系统有一个日志轮询的机制,每星期切换一个日志,变成 messages-xxxxxxxx,一个有5个这样的日志文件。比如:

[root@ryan ~]# ll /var/log/messag*
-rw------- 1 root root 302275 Jul 11 21:20 /var/log/messages
-rw------- 1 root root 201372 May 19 11:30 /var/log/messages-20180519
-rw------- 1 root root 101002 May 20 15:40 /var/log/messages-20180520
-rw------- 1 root root 402954 Jun  8 20:29 /var/log/messages-20180608
-rw------- 1 root root 402833 Jul  8 11:51 /var/log/messages-20180708

/etc/logrotate.conf 是日志的配置文件,可自定义上面的轮询周期和轮询次数等。

2.2 /var/log/secure

/var/log/secure 是和登录信息有关的日志文件。该日志文件记录验证和授权等方面的信息,比如 ssh 登录系统成功和失败时,相关的信息都会记录在这个日志里。

[root@ryan ~]# head /var/log/secure
Jul  9 04:54:32 ryan sshd[1929]: Did not receive identification string from 197.89.57.193 port 56887
Jul  9 06:33:37 ryan sshd[2495]: Invalid user admin from 117.131.245.4 port 57960
Jul  9 06:33:37 ryan sshd[2495]: input_userauth_request: invalid user admin [preauth]
Jul  9 06:33:37 ryan sshd[2495]: pam_unix(sshd:auth): check pass; user unknown
Jul  9 06:33:37 ryan sshd[2495]: pam_unix(sshd:auth): authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=117.131.245.4
Jul  9 06:33:39 ryan sshd[2495]: Failed password for invalid user admin from 117.131.245.4 port 57960 ssh2
Jul  9 06:33:39 ryan sshd[2495]: Connection closed by 117.131.245.4 port 57960 [preauth]
Jul  9 06:33:42 ryan sshd[2498]: Invalid user admin from 113.173.47.127 port 35463
Jul  9 06:33:42 ryan sshd[2498]: input_userauth_request: invalid user admin [preauth]
Jul  9 06:33:42 ryan sshd[2498]: pam_unix(sshd:auth): check pass; user unknown

2.3 /var/log/wtmp

/var/log/wtmp 记录了用户登录成功的历史,但是这个是二进制文件,不能直接使用 cat、vim 等工具来查看。而是使用 last 命令来查看。如下:

[root@ryan ~]# last | head
root     pts/0        124.89.91.5x     Wed Jul 11 21:29   still logged in
root     pts/0        124.89.91.5x     Sun Jul  8 21:48 - 23:36  (01:48)
root     pts/0        124.89.91.5x     Tue Jun 19 22:44 - 23:42  (00:57)
root     pts/0        124.89.91.5x     Sat May 26 14:29 - 18:07  (03:37)
root     pts/0        124.89.91.5x     Fri May 25 23:52 - 23:59  (00:07)
root     pts/0        124.89.91.5x     Wed May 23 20:03 - 23:39  (03:35)
root     pts/0        124.89.91.5x     Tue May 22 23:08 - 00:06  (00:58)
root     pts/0        124.89.91.5x     Mon May 21 21:42 - 22:47  (01:05)
root     pts/0        124.89.91.5x     Sun May 20 15:47 - 20:55  (05:07)
root     pts/0        124.89.91.5x     Sat May 19 14:34 - 01:37  (11:02)

2.4 /var/log/btmp

/var/log/btmp 记录了用户登录失败的历史,同时该文件也是二进制文件,需要使用 lastb 命令来查看。如下:

[root@ryan ~]# lastb | head
root     ssh:notty    221.131.87.254   Wed Jul 11 22:22 - 22:22  (00:00)
admin    ssh:notty    186.3.164.38     Wed Jul 11 19:19 - 19:19  (00:00)
admin    ssh:notty    186.3.164.38     Wed Jul 11 19:19 - 19:19  (00:00)
admin    ssh:notty    180.183.45.21    Wed Jul 11 19:18 - 19:18  (00:00)
admin    ssh:notty    180.183.45.21    Wed Jul 11 19:18 - 19:18  (00:00)
root     ssh:notty    58.218.198.161   Wed Jul 11 18:57 - 18:57  (00:00)
root     ssh:notty    58.218.198.161   Wed Jul 11 18:57 - 18:57  (00:00)
root     ssh:notty    58.218.198.161   Wed Jul 11 18:57 - 18:57  (00:00)
root     ssh:notty    58.218.198.161   Wed Jul 11 18:56 - 18:56  (00:00)
root     ssh:notty    58.218.198.161   Wed Jul 11 18:56 - 18:56  (00:00)

2.5 dmesg

dmesg 命令可以显示系统的启动信息,可以看到硬件的检测或者断开连接的信息,内核缓冲信息(kernel ring buffer)。用 dmesg 查看系统启动信息的文件对应为:/var/log/dmesg

[root@ryan ~]# dmesg | head
[    0.000000] Initializing cgroup subsys cpuset
[    0.000000] Initializing cgroup subsys cpu
[    0.000000] Initializing cgroup subsys cpuacct
[    0.000000] Linux version 3.10.0-693.2.2.el7.x86_64 (builder@kbuilder.dev.centos.org) (gcc version 4.8.5 20150623 (Red Hat 4.8.5-16) (GCC) ) #1 SMP Tue Sep 12 22:26:13 UTC 2017
[    0.000000] Command line: BOOT_IMAGE=/boot/vmlinuz-3.10.0-693.2.2.el7.x86_64 root=UUID=eb448abb-3012-4d8d-bcde-94434d586a31 ro crashkernel=auto rhgb quiet net.ifnames=0 console=tty0 console=ttyS0,115200n8
[    0.000000] e820: BIOS-provided physical RAM map:
[    0.000000] BIOS-e820: [mem 0x0000000000000000-0x000000000009fbff] usable
[    0.000000] BIOS-e820: [mem 0x000000000009fc00-0x000000000009ffff] reserved
[    0.000000] BIOS-e820: [mem 0x00000000000f0000-0x00000000000fffff] reserved
[    0.000000] BIOS-e820: [mem 0x0000000000100000-0x000000003ffdffff] usable

三、系统服务管理

3.1 ntsysv 服务配置工具

ntsysv 命令用来配置哪些服务开启或者关闭,类似于图形界面,不过是使用键盘来控制的。如果系统没有这个命令,请使用 yum install -y ntsysv 安装它,安装完毕之后运行 ntsysv 命令,如下:

可以使用空格来选中或者取消需要自动启动的服务,然后按 Tab 键来调到保存(OK)或者取消(Cancel),在按回车键。一般常用的服务如:crond、iptables、irqbalance、microcode_ctl、network、sendmail、sshd、syslog 均需要开启。修改之后需要重启服务器才能生效。

3.2 chkconfig 服务管理工具

Linux 系统所有的预设服务可以通过查看 /etc/init.d/ 目录得到,如下:

[root@ryan ~]# ll /etc/init.d
lrwxrwxrwx. 1 root root 11 Nov 12  2017 /etc/init.d -> rc.d/init.d
[root@ryan ~]# ls /etc/init.d
auditd     haldaemon  kdump       netconsole      nfs-rdma      rdma         saslauthd  udev-post
crond      halt       killall     netfs           postfix       restorecond  single     winbind
dnsmasq    ip6tables  mdmonitor   network         pppoe-server  rsyslog      sshd       wpa_supplicant
functions  iptables   messagebus  NetworkManager  rdisc         sandbox      sysstat

系统的预设服务都可以通过这样的命令实现:service 服务名 start|stop|restart。这里的服务名就是 /etc/init.d/ 目录下的这些文件名了。如启动时可以使用:"service crond start",也可以使用命令:"/etc/init.d/crond start"。

独立服务启动办法:

1)/etc/init.d/ 或 /etc/rc.d/init.d 独立服务名 start|stop|status|restart

2)service 独立服务名 start|stop|status|restart ——【Redhat系列专有命令】,其实 service 就是去/ etc/init.d/ 这个目录下寻找指定的服务

第一种方法是启动服务的万能方法,而通过 service启动服务是Redhat系列专有命令。start 表示启动服务,stop 表示停止服务,status 表示查看指定服务是否启动,restart 表示重启指定服务。

使用 "chkconfig --list" 列出所有的服务及其各服务在每个级别下的开启状态,如下:

[root@ryan ~]# chkconfig --list
NetworkManager  0:off   1:off   2:on    3:on    4:on    5:on    6:off
auditd          0:off   1:off   2:on    3:on    4:on    5:on    6:off
crond           0:off   1:off   2:on    3:on    4:on    5:on    6:off
dnsmasq         0:off   1:off   2:off   3:off   4:off   5:off   6:off
haldaemon       0:off   1:off   2:off   3:on    4:on    5:on    6:off
ip6tables       0:off   1:off   2:on    3:on    4:on    5:on    6:off
iptables        0:off   1:off   2:on    3:on    4:on    5:on    6:off
kdump           0:off   1:off   2:off   3:on    4:on    5:on    6:off
mdmonitor       0:off   1:off   2:on    3:on    4:on    5:on    6:off
messagebus      0:off   1:off   2:on    3:on    4:on    5:on    6:off
netconsole      0:off   1:off   2:off   3:off   4:off   5:off   6:off
netfs           0:off   1:off   2:off   3:on    4:on    5:on    6:off
network         0:off   1:off   2:on    3:on    4:on    5:on    6:off
nfs-rdma        0:off   1:off   2:off   3:off   4:off   5:off   6:off
postfix         0:off   1:off   2:on    3:on    4:on    5:on    6:off
pppoe-server    0:off   1:off   2:off   3:off   4:off   5:off   6:off
rdisc           0:off   1:off   2:off   3:off   4:off   5:off   6:off
rdma            0:off   1:off   2:off   3:off   4:off   5:off   6:off
restorecond     0:off   1:off   2:off   3:off   4:off   5:off   6:off
rsyslog         0:off   1:off   2:on    3:on    4:on    5:on    6:off
saslauthd       0:off   1:off   2:off   3:off   4:off   5:off   6:off
sshd            0:off   1:off   2:on    3:on    4:on    5:on    6:off
sysstat         0:off   1:on    2:on    3:on    4:on    5:on    6:off
udev-post       0:off   1:on    2:on    3:on    4:on    5:on    6:off
winbind         0:off   1:off   2:off   3:off   4:off   5:off   6:off
wpa_supplicant  0:off   1:off   2:off   3:off   4:off   5:off   6:off

这里所说的级别(数字0-6)就是 /etc/inittab 里面对应的启动级别,运行级别0、1和6被系统保留。其中0作为 shutdown 动作,1作为重启至单用户模式,6为重启。在一般的 LInux 系统实现中,都是用 2、3、4、5 几个级别。在 CentOS 中,2表示无NFS支持的多用户模式,3表示完全多用户模式(最常用),4保留给用户自定义,5表示图形化登录方式。

开启或关闭某个服务的命令格式是:

chkconfig --level 级别 服务名 off/on

例如:

# chkconfig --level 345 crond off

--level 后面可以指定多个级别,默认是针对级别2、3、4和5操作的。

chkconfig 还可以把某个服务加入到系统服务或者删除,即可以使用 "chkconfig --add 服务名" 或者 "chkconfig --del 服务名"来操作,如下:

# chkconfig --add crond

# chkconfig --list |grep crond 或者 # chkconfig --list crond

# chkconfig --del crond

四、xargs 与 exec

xargs 与 exec 可以实现相同的功能,exec 主要是和 find 一起配合使用,是 find 的一个选项,而 xargs 比 exec 功能更多,常用在管道符之后。

4.1 xargs 应用

xargs命令是给其他命令传递参数的一个过滤器,也是组合多个命令的一个工具。它擅长将标准输入数据转换成命令行参数,xargs 能够处理管道或者stdin并将其转换成特定命令的命令参数。xargs也可以将单行或多行文本输入转换为其他格式,例如多行变单行,单行变多行。xargs 的默认命令是 echo,空格是默认定界符。这意味着通过管道传递给 xargs 的输入将会包含换行和空白,不过通过 xargs 的处理,换行和空白将被空格取代。xargs 是构建单行命令的重要组件之一。

比如查找当前目录下创建时间大于10天的文件,然后删除。命令如下:

# find . -mtime +10 |xargs rm -rf

批量命名文件,将当前目录下所有的 txt 文件统一添加后缀_bak。命令如下:

# ls *.txt |xargs -n1 -i{} mv {} {}_bak

如下所示:

[root@ryan mytest]# ll
total 12
-rw-r--r-- 1 root root 4 Jul 12 22:05 1.txt
-rw-r--r-- 1 root root 4 Jul 12 22:06 2.txt
-rw-r--r-- 1 root root 4 Jul 12 22:06 3.bat
[root@ryan mytest]# ls *.txt |xargs -n1 -i{} mv {} {}_bak
[root@ryan mytest]# ll
total 12
-rw-r--r-- 1 root root 4 Jul 12 22:05 1.txt_bak
-rw-r--r-- 1 root root 4 Jul 12 22:06 2.txt_bak
-rw-r--r-- 1 root root 4 Jul 12 22:06 3.bat

其中,"xargs -n1 -i{}" 类似于 for 循环,-n1 表示对逐个对象进行处理,-i{} 表示用 {} 取代前面的对象,mv {} {}_bak相当于 mv file1.txt file1.txt_bak。

xargs 命令用法

xargs 用作替换工具,读取输入数据重新格式化后输出。

定义一个测试文件,内有多行文本数据:

cat test.txt

a b c d e f g
h i j k l m n
o p q
r s t
u v w x y z

多行输入单行输出:

cat test.txt | xargs

a b c d e f g h i j k l m n o p q r s t u v w x y z

-n选项多行输出:

cat test.txt | xargs -n3

a b c
d e f
g h i
j k l
m n o
p q r
s t u
v w x
y z

-d选项可以自定义一个定界符:

echo "nameXnameXnameXname" | xargs -dX

name name name name

结合-n选项使用:

echo "nameXnameXnameXname" | xargs -dX -n2

name name
name name

xargs的一个选项-I,使用-I指定一个替换字符串{},这个字符串在xargs扩展时会被替换掉,当-I与xargs结合使用,每一个参数命令都会被执行一次:

cat arg.txt | xargs -I {} ./sk.sh -p {} -l

-p aaa -l
-p bbb -l
-p ccc -l

-i[replace-str] 选项已经过期,使用 -I 选项代替。

4.2 exec 应用

exec 命令用于调用并执行指令的命令。exec 命令通常用在 shell 脚本程序中,可以调用其他的命令。如果在当前终端中使用命令,则当指定的命令执行完毕后会立即退出终端。-exec 作为 find 命令的选项,与 -ok 选项的作用类似,但是会询问用户(Like  -exec but ask the user first)。

比如查找当前目录下创建时间大于10天的文件并删除:

# find . -mtime +10 -exec rm -rf {} \;

这个命令中也是用 {} 替代前面 find 出来的文件。后的 \ 作为 ; 的转义符,否则 shell 会把分号作为该行命令的结尾。

-exec 同样可以实现上面提到的批量命名的功能,如下:

# find ./*.txt -exec mv {} {}_bak \;

五、screen 工具

5.1 使用 nohup

nohup

使用 & 命令后,作业被提交到后台运行,当前控制台没有被占用,但是一但把当前控制台关掉(退出帐户时),作业可能就会停止运行。nohup 命令可以在你退出账户之后继续运行相应的进程。nohup 就是不挂起的意思(no hang up)。该命令的一般形式为:

# nohup command &

如果使用 nohup 命令提交作业,那么在缺省情况下该作业的所有输出都被重定向到一个名为 nohup.out 的文件中,除非另外指定了输出文件:

# nohup command > myout.file 2>&1 &

使用了 nohup 之后,很多人就这样不管了,其实这样有可能在当前账户非正常退出或者结束的时候,命令还是自己结束了。所以在使用 nohup 命令后台运行命令之后,需要使用exit正常退出当前账户,这样才能保证命令一直在后台运行。

5.2 screen 工具

screen 是一个可以在多个进程之间多路复用一个物理终端的窗口管理器。screen 中有会话的概念,用户可以在一个screen会话中创建多个screen窗口,在每个screen窗口中创建多个 screen 窗口,在每一个screen窗口中就像操作一个真实的SSH连接窗口一样。

screen 默认没有安装在 Linux 中,可以使用如下命令安装:

# yum install -y screen

 运行 # screen 命令后会打开一个新的screen会话:

[root@ryan ~]# screen -ls
There is a screen on:
        1935.pts-1.ryan (Attached)
1 Socket in /var/run/screen/S-root.

如下所示:

然后按 Ctrl+a+d 键(先按 Ctrl+a,再按d)可以退出该 screen 会话,此时只是退出,并没有结束,结束 screen 会话要按 Ctrl+a 键或者输入 exit

[root@ryan ~]# screen
[detached]
[root@ryan ~]# screen -ls
There is a screen on:
        1935.pts-1.ryan (Detached)
1 Socket in /var/run/screen/S-root.

退出后如果还想再次登录某个 screen 会话,可以使用命令:screen -r [screen 编号],比如上面的 1935。如果只打开了一个 screen 会话,后面的编号可以省略。

当我们有某个需要长时间运行的命令或者脚本时就打开一个 screen 会话, 然后运行该任务,按 Ctrl+a 键,在按d退出会话,这样就不会影响终端窗口上其他的操作了。

 

posted on 2018-07-12 22:46  沐小悠  阅读(2311)  评论(0编辑  收藏  举报