【CentOS】正则表达式

1.grep  [-cinvABC]  'word'  filename

  -c :打印符合要求的行数

  --color:显示颜色

  -i :忽略大小写(ignore)

  -n :在输出符合要求的行的同时连同行号一起输出(number)

  -v :打印不符合要求的行(取反)

  -A :后跟一个数字(有无空格都可以),例如 –A2则表示打印符合要求的行以及下面两行(after)

  -B :后跟一个数字,例如 –B2 则表示打印符合要求的行以及上面两行(before)

  -C :后跟一个数字,例如 –C2 则表示打印符合要求的行以及上下各两行 

  -E  :允许使用拓展正则表达式(extended regular  expression)

  -r  :遍历

 

  注意:"." 表示任意一个字符                       eg: grep -E 'ro.t' 1.txt= egrep 'ro.t' 1.txt,可以过滤出root

          ".*"表示零个或多个任意字符,           eg: grep -E 'ro.*t' 1.txt= egrep 'ro.*t' 1.txt,可以过滤出rot,rosadat,roo...t 

          "?"表示零个或一个跟在他前面的字符, eg: grep -E 'ro?t' 1.txt = egrep 'ro?t' 1.txt ,"o?"可以过滤出rt,rot        (这时你想到.*是什么意思了吗,手动滑稽)

          "+"表示一个或多个根子他前面的字符, eg: grep -E 'ro+t' 1.txt = egrep 'ro+t' 1.txt ,"o+"可以过滤rot,root,rooo...t

          也可以这样用:...(oo+) 1.txt  ;         ...(oo){1,2} 1.txt,{}内为数字,表示重复次数

          [^a]:[]括号内的^表示除了..也就是取反、非的意思

 

2.sed      (查找替换)

 查找:

 sed -n 'np' 1.txt    列出第几行

      -n  :取消默认输出

      np  :n为第几行,列出多行可以'1,10p',表示为列出1-10行,'5-$'列出第五行到行尾

  sed -n '/root/p' 1.txt   列出包含root的行

 多行为

  sed -n -e '/root/p'  -e 'np'  1.txt  

      -e  :实现多个行为

 删除

  sed '1,5d'  删除1-5行

 替换

  sed 's///g'  替换(这个类似vim), eg: sed -r '5,$s#([^:]+)(:.*+:)([^:]+$)#\3\2\1#' 1.txt,表示为替换第五行到最后一行每一行的首尾单词

      -r  :允许使用拓展正则表达式(extended regular  expression)

 

  注意:由于\符号在涉及到路径时,很容易混淆,因此可以用#,@来替代

3.awk

  截取:

    awk -F':' '{print $1,$2}' 1.txt

    -F :指定分隔符,如果不使用则默认为空格和Tab制表符。注意!!-F后面的''一定要紧贴着的!!

    print 为打印的动作,打印出某个字段,$1为第一个字段,$2为第二个,$0为整行

 

  匹配字符或字符串:

    匹配~:

      awk -F':' '$1~/oo/' 1.txt ,表示为让$1段去匹配

      awk -F':' '/root/ {print $1,$3} /test/ {print $1,$3}' 1.txt,表示为多次匹配,匹配完root后再匹配test(还不怎么熟悉的)

 

  条件运算符:

    可以使用>,<,>=,<=,==,!=,&&,||

    awk -F':' '$3=="0"' 1.txt ,表示为打印出第三个字段为"0"字符的行,若果是'$3==0',才是数字,否则会像sort的排序原理一样

    awk -F':' '$3!="/bin/bash"' 1.txt,表示为打印出第三个字段不为/bin/bash的行。

    awk -F':' '$3<$4' && '$3<=7' 1.txt,表示为打印出第三个字段小于第四个字段并且第三个字段小于7的行

 

  内置变量:

    awk常用的变量有:

      NF:用分隔符分隔后一共有多少段

      NR:行数

      因此,$NF为最后一段的值,NR为行号,NF、NR可作为判断的条件,如:'$NF>=10' ,最后一段的值大于等于10

    总和???????不懂,日后补充吧

posted @ 2016-11-06 21:46  ImJerryChan  阅读(1202)  评论(0编辑  收藏  举报