linux运维、架构之路-正则表达式

一、通配符的含义

符号	参数说明	其他说明
\|	管道	把前一个命令结果通过管道传递给后面一个命令
;	命令的分隔符	ll /oldboy/;cat oldboy.tx
.	表示当前目录
*	匹配文本或字符串	ls .txt,ls .log
/	根或路径的分隔符
&&	命令分隔	表示并且，前一个执行成功才会执行后面的
$	取变量的值	echo $PATH
{}	配合echo打印序列	echo {1..6}

通配符中以*和{}最为常用

1、举例说明

①查找/oldboy下所有.txt文件

[root@oldboyedu37 oldboy]# find /oldboy -type f -name "*.txt"
/oldboy/abc.txt
/oldboy/oldboy.txt
/oldboy/a.txt

②在/oldboy目录下批量创建10个以文件，例如：oldboy1-oldboy10.txt

[root@oldboyedu37 oldboy]# touch oldboy{1..10}.txt
[root@oldboyedu37 oldboy]# ls -lrt
-rw-r--r-- 1 root root        0 Jun  5 17:58 oldboy9.txt
-rw-r--r-- 1 root root        0 Jun  5 17:58 oldboy8.txt
-rw-r--r-- 1 root root        0 Jun  5 17:58 oldboy7.txt
-rw-r--r-- 1 root root        0 Jun  5 17:58 oldboy6.txt
-rw-r--r-- 1 root root        0 Jun  5 17:58 oldboy5.txt
-rw-r--r-- 1 root root        0 Jun  5 17:58 oldboy4.txt
-rw-r--r-- 1 root root        0 Jun  5 17:58 oldboy3.txt
-rw-r--r-- 1 root root        0 Jun  5 17:58 oldboy2.txt
-rw-r--r-- 1 root root        0 Jun  5 17:58 oldboy1.txt
-rw-r--r-- 1 root root        0 Jun  5 17:58 oldboy10.txt

③{}备份文件作用

[root@oldboyedu37 oldboy]# cp oldboy.txt{,.bak}
-rw-r--r-- 1 root root       29 Jun  5 18:01 oldboy.txt.bak

二、正则表达式

1、基本正则表达式（BRE,basic）

符号	参数说明	其他说明
^	以……开始	^word表示以word开始的行或字符串
[^]	在[]里面^表示非	[^word]不包含word的行或字符串
$	以……结尾	word$表示以word结尾的行或字符串
.	代表任意一个字符
*	匹配前一个字符0次或多次
.*	匹配所有
+	匹配前一个字符1次或多次
^$	表示空行	可以理解为以结尾开始，或以开始结尾
{n,m}	匹配前一个字符n到m次
\	转译符号	让一个特殊的字符还原它本来的意义

2、扩展正则表达式（ERE）

3、正则表达式应用——别名环境变更配置vi/etc/profile

主要是给grep和egrep加—color过滤出的内容显示颜色

4、正则表达式使用案例

①模拟环境

[root@oldboyedu37 tmp]# cat oldboy.txt 
I am oldboy teacher!
I teach linux.

I like badminton ball ,billiard ball and chinese chess!
my blog is http://oldboy.blog.51cto.com
our site is http://www.etiantian.org
my qq num is 49000448.

not 4900000448.
my god ,i am not oldbey,but OLDBOY!

②过滤出oldboy.txt以my开头的行

[root@oldboyedu37 tmp]# grep "^my" oldboy.txt 
my blog is http://oldboy.blog.51cto.com
my qq num is 49000448.
my god ,i am not oldbey,but OLDBOY!

③过滤出oldboy.txt以m结尾的行

[root@oldboyedu37 tmp]# grep "m$" oldboy.txt 
my blog is http://oldboy.blog.51cto.com

④^$、过滤出oldboy.txt文件的空行

[root@oldboyedu37 tmp]# grep -n "^$" oldboy.txt 
3:
8:

⑤\. 过滤出oldboy.txt以.结尾的行 .在与三剑客配置中有特殊意义，所以使用撬棍\转译

[root@oldboyedu37 tmp]# grep "\.$" oldboy.txt 
I teach linux.
my qq num is 49000448.
not 4900000448.

⑥.*匹配所有内容 grep ".*" oldboy.txt

[root@oldboyedu37 tmp]# grep ".*" oldboy.txt 
I am oldboy teacher!
I teach linux.

I like badminton ball ,billiard ball and chinese chess!
my blog is http://oldboy.blog.51cto.com
our site is http://www.etiantian.org
my qq num is 49000448.

not 4900000448.
my god ,i am not oldbey,but OLDBOY!

⑦[ABC]过滤出oldboy.txt文件中以m或n或o开头的行，并且以m或g结尾的行

法一：[root@oldboyedu37 tmp]# grep "^[mon]" oldboy.txt|grep "[mg]$"
my blog is http://oldboy.blog.51cto.com
our site is http://www.etiantian.org

法二：[root@oldboyedu37 tmp]# grep "^[mon].*[mg]$" oldboy.txt
my blog is http://oldboy.blog.51cto.com
our site is http://www.etiantian.org

⑧[^ABC] 排除oldboy.txt文件中以m或n的行

[root@oldboyedu37 tmp]# grep "^[^mn]" oldboy.txt 
I am oldboy teacher!
I teach linux.
I like badminton ball ,billiard ball and chinese chess!
our site is http://www.etiantian.org

5、扩展正则表达式（ERE）egrep

①+匹配前一个字符连续出现1次或多次

[root@oldboyedu37 tmp]# egrep "0+" oldboy.txt 
my qq num is 49000448.
not 4900000448.

②|配合egrep同时可以过滤多个字符串

[root@oldboyedu37 tmp]# egrep "3306|1521" /etc/services 
mysql           3306/tcp                        # MySQL
mysql           3306/udp                        # MySQL
ncube-lm        1521/tcp                # nCube License Manager
ncube-lm        1521/udp                # nCube License Manager

③{n，m} 重复前面的字符n到m次

[root@oldboyedu37 tmp]# egrep "0{1,5}" oldboy.txt 
my qq num is 49000448.
not 4900000448.

6、小试牛刀

①利用sed取ip地址

方法一：
定位到ip地址所在的行
[root@oldboyedu37 tmp]# ifconfig eth0|sed -n '2p'
inet addr:10.0.0.8  Bcast:10.0.0.255  Mask:255.255.255.0
匹配掐头去尾取想要的内容
[root@oldboyedu37 tmp]# ifconfig eth0|sed -n '2p'|sed 's#^.*ddr:##g'|sed 's#  Bc.*$##g'
10.0.0.8

方法二：[root@oldboyedu37 tmp]# ifconfig eth0|sed -n '2p'|sed -r 's#^.*ddr:|Bc.*$##g'
10.0.0.8

方法三：利用sed的后向引用
[root@oldboyedu37 tmp]# ifconfig eth0|sed -n '2p'|sed -r 's#^.*ddr:(.*)Bc.*$#\1#g'
10.0.0.8

方法四：sed直接定位所取的行并匹配替换
[root@oldboyedu37 tmp]# ifconfig eth0|sed -nr '2s#^.*ddr:(.*)Bc.*$#\1#gp'
10.0.0.8

②取/etc/hosts文件属性权限

方法一：[root@oldboyedu37 tmp]# stat /etc/hosts|sed -nr '4s#^.*\(0(.*)/-.*$#\1#gp'
644
方法二：[root@oldboyedu37 tmp]# stat /etc/hosts|sed -n '4p'|sed 's#^.*(0##g'|sed 's#/-.*$##g'
644
方法三：利用stat命令带的参数直接取出
[root@oldboyedu37 tmp]# stat -c %a /etc/hosts
644

7、date显示时间

①工作中常配合tar命令打包使用

[root@oldboyedu37 /]# tar zcvf oldboy_$(date +%F).tar.gz oldboy/
oldboy/
oldboy/netstat.log
oldboy/web_url.log
oldboy/oldboy.txt
oldboy/t1.awk
oldboy/access-test.log
oldboy/.bak
oldboy/oldboy.log

②简写几天前、几天后

date -d '+3day'    #——>显示3天后的日期时间
date -d '-3day'    #——>显示3天前的日期时间
date -d '-3hour'   #——>显示3小时前的日期时间
[root@oldboyedu37 /]# date +%F -d '-1day'——工作中常用方法打包，打包一天前

三、AWK格式及使用正则

1、通过awk取出passwd的第5行内容

[root@nfs-server oldboy]# awk 'NR==5' passwd 
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

2、显示passwd第五行的最后一列

[root@nfs-server oldboy]# awk -F ":" 'NR==5{print $NF}' passwd 
/sbin/nologin

3、找出passwd中以root开头的行

[root@nfs-server oldboy]# awk '/^root/' passwd 
root:x:0:0:root:/root:/bin/bash

4、找出passwd第六列中包含home的行

[root@nfs-server oldboy]# awk -F ":" '$6~/home/' /etc/passwd 
salt:x:500:500::/home/salt:/bin/bash

小题：

已知[root@nfs-server files]# cat reg.txt 
Zhang Dandan    41117397   :250:100:175
Zhang Xiaoyu    390320151  :155:90:201
Meng  Feixue    80042789   :250:60:50
Wu    Waiwai    70271111   :250:80:75
Liu   Bingbing  41117483   :250:100:175
Wang  Xiaoai    3515064655 :50:95:135
Zi    Gege      1986787350 :250:168:200
Li    Youjiu    918391635  :175:75:300
Lao   Nanhai    918391635  :250:100:175
说明：
###第一列是姓氏
###第二列是名字
###第一第二列合起来就是姓名
###第三列是对应的ID号码
###最后三列是三次捐款数量

①姓氏是Zhang的人，显示他的第二次捐款金额及她的名字

[root@nfs-server files]# awk -F "[ :]+" '/^Zhang/{print $1,$2,$5}' reg.txt 
Zhang Dandan 100
Zhang Xiaoyu 90

②显示Xiaoyu的姓氏和ID号码

[root@nfs-server files]# awk '$2~/Xiaoyu/{print $1,$3}' reg.txt
Zhang 390320151

③显示所有以41开头的ID号码的人的全名和ID号码

[root@nfs-server files]# awk '$3~/^41/{print $1,$2,$3}' reg.txt 
Zhang Dandan 41117397
Liu Bingbing 41117483

④显示所有以一个D或X开头的人名全名

[root@nfs-server files]# awk '$2~/^[DX]/{print $1,$2}' reg.txt 
Zhang Dandan
Zhang Xiaoyu
Wang Xiaoai

⑤显示所有ID号码最后一位数字是1或5的人的全名

[root@nfs-server files]# awk '$3~/[15]$/{print $1,$2}' reg.txt 
Zhang Xiaoyu
Wu Waiwai
Wang Xiaoai
Li Youjiu
Lao Nanhai

⑥显示Xiaoyu的捐款.每个值时都有以$开头.如$520$200$135

方法一：[root@nfs-server files]# awk '/Xiaoyu/{print $4}' reg.txt|tr ":" "$"
$155$90$201
方法二：
[root@nfs-server files]# awk '/Xiaoyu/{gsub(/:/,"$",$NF);print $NF}' reg.txt 
$155$90$201
方法三：
[root@nfs-server files]# awk '/Xiaoyu/{print $4}' reg.txt|sed 's#:#$#g'
$155$90$201

⑦显示所有人的全名，以姓,名的格式显示，如Meng,Feixue

[root@nfs-server files]# awk '{print $1","$2}' reg.txt 
Zhang,Dandan
Zhang,Xiaoyu
Meng,Feixue
Wu,Waiwai
Liu,Bingbing
Wang,Xiaoai
Zi,Gege
Li,Youjiu
Lao,Nanhai

四、 AWK数组计算

1、计算/etc/services 文件有多少个空行 awk

[root@nfs-server files]# awk  '/^$/{i=i+1}END{print i}' /etc/services 
16

2、已知：cat url.txt，计算出域名出现的次数

http://www.etiantian.org/index.html

http://www.etiantian.org/1.html

http://post.etiantian.org/index.html

http://mp3.etiantian.org/index.html

http://www.etiantian.org/3.html

http://post.etiantian.org/2.html

方法一：[root@nfs-server files]# awk -F "[/.]+" '{print $2}' url.txt|sort|uniq -c
      1 mp3
      2 post
      3 www
方法二：数组方法：[root@nfs-server files]# awk -F "[/.]+" '{hotel[$2]++}END{for(pol in hotel)print pol,hotel[pol]}' url.txt 
www  3
mp3  1
post 2

3、使用awk计算1加到100

方法一：[root@nfs-server files]#  awk 'BEGIN{ for(i=1;i<=100;i++) sum=sum+i;print sum}'
5050
方法二：
[root@nfs-server files]# seq 100|awk '{hotel=hotel+$1}END{print hotel}'
5050

4、假如现在有个文本，格式如下：

a 1

b 3

c 2

d 7

b 5

a 3

g 2

f 6

d 9

即左边是随机字母，右边是随机数字，要求写个脚本使其输出格式为：

a 4

b 8

c 2

d 16

f 6

g 2

解答：

[root@nfs-server files]# awk '{hotel[$1]=hotel[$1]+$2}END{for(pol in hotel)print pol,hotel[pol]}' a.txt 
a 4
b 8
c 2
d 16
f 6
g 2

posted @ 2017-09-20 14:26 闫新江阅读(436) 评论(0) 编辑收藏举报

刷新页面返回顶部

Demon

linux运维、架构之路-正则表达式

公告