扩展正则表达式及应用
第1章 扩展正则表达式
1.1 + 前一个字符连续出现了1次或1次以上
egrep "0+" clsn.txt 1次或1次以上 >=1
egrep "0*" clsn.txt 0次或0次以上 >=0
1.1.1 找到文本中的0
[root@znix ~]# egrep "0+" clsn.txt
my qq num is 49000448.
not 4900000448.
[root@znix ~]# egrep -o "0+" clsn.txt
000
00000
1.1.2 取出文件中的大写字母
[root@znix ~]# grep -o "[A-Z]" clsn.txt
I
I
I
O
L
D
B
O
Y
1.1.3 取出连续出现的大写字母
[root@znix ~]# egrep -o "[A-Z]+" clsn.txt
I
I
I
clsn
1.1.4 显示所有的单词
[root@znix ~]# egrep -o "[A-Za-z]+" clsn.txt
I
am
clsn
teacher
1.2 | 或者
表示找其中的一个或者是另外一个。
[root@znix ~]# egrep "clsn|oldbey" clsn.txt -o
clsn
clsn
oldbey
找/etc/services 中的两个端口
[root@znix ~]# egrep "3306|1521" /etc/services
mysql 3306/tcp # MySQL
mysql 3306/udp # MySQL
ncube-lm 1521/tcp # nCube License Manager
ncube-lm 1521/udp # nCube License Manager
找其中的A或者B或者C。
[root@znix ~]# egrep "A|B|C" clsn.txt
my god ,i am not oldbey,but clsn!
找到12或者56替换成空。
[root@znix ~]# echo 123456|sed -r 's#12|56##g'
34
1.3 () 小括号 反向引用
小括号里面的内容是一个整体,相当于是一个字符
1.3.1 表示一个整体
[root@znix ~]# egrep "oldb(o|e)y" clsn.txt
I am clsn teacher!
my blog is http://clsn.blog.51cto.com
my god ,i am not oldbey,but clsn!
1.3.2 反向引用
sed -r 使用扩展正则
[root@znix ~]# echo 123456|sed -r 's#..(..)..#\1#g'
34
点表示任意一个字符,\2表示第二个括号。
[root@znix ~]# echo 123456|sed -r 's#(.).(..).(.)#\2#g'
34
1.4 {} 大括号(花括号)
0{n,m} 数字0连续出现了至少n次,最多m次
[root@znix ~]# egrep "[a-z]{3,6}" clsn.txt
I am clsn teacher!
I teach linux.
I like badminton ball ,billiard ball and chinese chess!
my blog is http://clsn.blog.51cto.com
our site is http://www.etiantian.org
my qq num is 49000448.
not 4900000448.
my god ,i am not oldbey,but clsn!
[root@znix ~]# egrep "[a-zA-Z]{3,6}" clsn.txt
I am clsn teacher!
I teach linux.
I like badminton ball ,billiard ball and chinese chess!
my blog is http://clsn.blog.51cto.com
our site is http://www.etiantian.org
my qq num is 49000448.
not 4900000448.
my god ,i am not oldbey,but clsn!
[root@znix ~]#
1.4.1 大括号的不同方法
0{3,6} >=3 <=6
0{3} ==3
0{3,} >=3
0{,6} >=0 <=6
1.5 ?
前一个字符连续出现了 0次或1次
1.5.1 环境
[root@znix ~]# cat a.log
good
gd
god
goood
1.5.2 o连续出现0次或1次
[root@znix ~]# egrep "gd|god" a.log
gd
god
[root@znix ~]# egrep "go?d" a.log
gd
god
1.6 正则表达式分类
1.6.1 基础正则
^ 以……开头
$ 以……结尾
^$ 空行
.* 所有
[abc] 表示abc
[a-z] 表示a到z
[A-Z] 表示A-Z
[^abc] 表示排除abc
1.6.2 扩展正则表达式
+ 连续出现 1次或1次以上
| 或者
() 小括号里面的内容是一个整体,相当于是一个字符
{} 0{n,m} 数字0连续出现了至少n次,最多m次
? 前一个字符连续出现了 0次或1次
第2章 取出eth0网卡的ip地址
2.1 思路
1)先定位 取出第二行
2)取出ip地址
2.1.1 看eth0的内容
[root@znix ~]# ifconfig eth0
eth0 Link encap:Ethernet HWaddr 00:0C:29:A8:E4:14
inet addr:10.0.0.201 Bcast:10.0.0.255 Mask:255.255.255.0
inet6 addr: fe80::20c:29ff:fea8:e414/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:86884 errors:0 dropped:0 overruns:0 frame:0
TX packets:74978 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:14324203 (13.6 MiB) TX bytes:26220378 (25.0 MiB)
2.2 方法一 sed 去头去尾
用sed命令,将其中不需要显示的,逐步替换。
[root@znix ~]# ifconfig eth0|sed -n '2p'|sed 's#^.*dr:##g'|sed 's# .*$##g'
10.0.0.201
2.3 方法二sed 反向引用
反向替换,使用()把ip地址保护起来,\1方向选择,显示出来ip。
[root@znix ~]# ifconfig eth0|sed -nr '2s#^.*dr:(.*) Bc.*$#\1#gp'
10.0.0.201
简写👆
[root@znix ~]# ifconfig eth0|sed -n '2p'|sed -r 's#^.*dr:(.*)Bc.*$#\1#g'
10.0.0.201
2.4 方法三
使用把[^0-9.]之外的替换成空格,使用awk取出第一列。
[root@znix ~]# ifconfig eth0|sed -n '2s#[^0-9.]# #gp'|awk '{print $1}'
10.0.0.201
2.5 方法四
awk 指定分隔符,将空格和分号都定为分隔符,然后取列。
[root@znix ~]# ifconfig eth0|sed -n '2p'|awk -F "[ :]+" '{print $4}'
10.0.0.201
第3章 第三关练习题
3.1 如何取得/etiantian文件的权限对应的数字内容,如-rw-r--r--为644,要求使用命令取得644 这样的数字。
3.1.1 方法一 反向引用
使用反向引用,保护要取出的内容。
[root@znix ~]# stat /etc/services |sed -nr '4s#^.*\(0(.*)/-.*$#\1#gp'
644
3.1.2 方法二 掐头去尾
两个sed 将不需要的东西替换为空。
[root@znix ~]# stat /etc/hosts |sed -n '4s#^.*(0##gp'|sed 's#/.*$##g'
644
3.1.3 方法三 排除
[^0-7] 除了0到7以外的替换成空格
[root@znix ~]# stat /etc/hosts |sed -n '4s#[^0-7]##gp'
064400
[root@znix ~]# stat /etc/hosts|sed -nr '4s#[^0-7]+# #gp'
0644 0 0
第4章 特殊符号、通配符
4.1 特殊符号
&& 并且 前面的执行对了执行后面
|| 或者 前面命令执行失败了再执行后面的
>> 追加输出重定向
> 标准输出重定向
/ 根 路径的分隔符
$ 取变量的内容
. 当前目录
.. 当前目录的上一级目录
~ 家目录
| 管道
! 取反 find awk
# 注释
4.2 通配符
* {} 找出文件
4.3 正则表达式(三剑客grep sed awk使用)
^
$
^$
.*
[abc] 一个整体 a或b或c
正则表达式认为只要是在中括号里面的就是一样的.
[^abc] 出a或b或c之外