第二部分shell编程2正则(grepegrepsedawk)
一、grep/egrep
1. 语法+选项
语法: grep [-cinvABC] 'word' filename
-c :打印符合要求的行数
-n :在输出符合要求的行的同时连同行号一起输出
-v :打印不符合要求的行 ,取反===
-A :后跟一个数字(有无空格都可以),例如 –A2则表示打印符合要求的行以及下面两行
-B :后跟一个数字,例如 –B2 则表示打印符合要求的行以及上面两行
-C :后跟一个数字,例如 –C2 则表示打印符合要求的行以及上下各两行
-r : 会把目录下面所有的文件全部遍历
-i :不区分大小写
-o :只过滤符合条件的字段
2. 例子介绍
过滤出带有某个关键词的行并输出行号 grep -n 'root' 1.txt
过滤出不带有某个关键词的行并输出行号grep -n -v 'root' 1.txt
过滤出所有包含数字的行 grep '[0-9]' 1.txt
过滤出所有不包含数字的行 grep -v '[0-9]' 1.txt
去除所有以'#'开头的行 grep -v '^#' 1.txt ^表示以什么开头,就是剩下不以#号开头的行了
去除所有空行和以'#'开头的行 grep -v '^$' 1.txt |grep -v '^#' ^$代表以空行开头,| 并且的意思====
过滤出以英文字母开头的行 grep '^[a-zA-Z]' 1.txt
过滤出以非数字开头的行 grep '^[^0-9]' 1.txt ^0-9代表非数字的意思
去除掉以数字开头剩下的行 grep -v '^[0-9]' 1.txt
=======================================
过滤任意一个或多个字符
grep 'r.o' 1.txt; grep 'r*t' 1.txt; grep'r.*t' 1.txt
. 表示任意一个字符;*表示零个或多个前面的字符 ;.*表示零个或多个任意字符,空行也包含在内
=========================================
指定过滤字符次数 grep 'o\{2\}' 1.txt !!!!
grep -E ==egrep
cgrep -E 'r?o' 1.txt E表示可以用特殊符号?
cgrep -E 'r?o' 1.txt == cgrep 'o' 1.txt || cgrep 'ro' 1.txt
grep --color 'root' 1.txt
alias cgrep='grep --color' 也可以写在.bashrc里面 用source .bashrc 重置一下
grep -E ==egrep
3. egrep
egrep工具 是grep工具的扩展
egrep 'o+' 1.txt 表示1个或1个以上前面字符
egrep 'o?' 1.txt 表示0个或者1个前面字符
egrep 'roo|body' 1.txt 匹配roo或者匹配body ======
egrep 'r(oo)|(at)o' 1.txt 用括号表示一个整体
egrep '(oo)+' 1.txt 表示1个或者多个 'oo'
egrep 'sbin' 1.txt |egrep 'post' 并且的意思=======!!!!!!和&&有什么区别
awk -F ':' '$3>"5" && $3<"7"' 1.txt
egrep 'o{2}' 1.txt 表示筛选o出现几次的行
4. . * + ? 总结
. 表示任意一个字符(包括特殊字符)
* 表示零个或多个*前面的字符
.* 表示零个或多个任意字符(包含空行)
+ 表示1个或多个+前面的字符
? 表示0个或1个?前面的字符
其中 + ? grep不支持,egrep才支持。
? + () | 这几个字符才需要脱意 ==========
二. sed --- 一般替换和打印行
打印指定行 sed '10'p -n 1.txt; sed '1,4'p -n 1.txt; sed '5,$'p -n 1.txt
n就是把匹配到的p是打印的意思
打印包含某个字符串的行 sed -n '/root/'p 1.txt 可以使用 ^ . * $等特殊符号==
-e 可以实现同时进行多个任务 sed -e '/root/p' -e '/body/p' -n 1.txt 也可以用;实现 sed '/root/p; /body/p' -n 1.txt
删除行
sed '/root/d' 1.txt; sed '1d' 1.txt; sed '1,10d' 1.txt
sed -i '/root/d' 1.txt 这里直接就删除了文件的东西了
替换 sed '1,2s/ot/to/g' 1.txt, 其中s就是替换的意思,g为全局替换,否则只替换第一次的,/也可以为 #, @ 等
sed 's/BASH/1212/gi' 1.txt i表示不区分大小写的替换========只在替换的时候用===========
清楚空行,在内容前面和后面添加内容
sed '/^$/d; s/^/AAA/g; s/$/BBB/g' input.txt
删除所有数字 sed 's/[0-9]//g' 1.txt ===
删除所有非数字sed 's/[^0-9]//g' 1.txt
调换两个字符串位置 head -n2 1.txt |sed 's/\(root\)\(.*\)\(bash\)/\3\2\1/'
在test.txt 20行到末行最前面加 'aaa:'
sed -r '20,$s#(^.*$)#aaa:\1#g' 1.txt (^.*$)表示一整行,\1表示(^.*$)
直接修改文件内容 sed -i 's/ot/to/g' 1.txt
grep -E ;sed -r ; egrep 都表示才可以用后面的脱意符号
sed练习题:
把/etc/passwd 复制到/root/test.txt,用sed打印所有行
打印test.txt的3到10行 sed 3,10p -n test.txt
打印test.txt 中包含 'root' 的行 sed /root/p -n test.txt
删除test.txt 的15行以及以后所有行 sed '3,$d' test.txt
删除test.txt中包含 'bash' 的行 sed '/root/d' test.txt
替换test.txt 中 'root' 为 'toor' sed 's/root/toor/g' test.txt
替换test.txt中 '/sbin/nologin' 为 '/bin/login'
sed 's#/sbin/nologin#/bin/login#g' 1.txt
删除test.txt中5到10行中所有的数字
sed '5,10s#[0-9]##g' 1.txt =======
删除test.txt 中所有特殊字符(除了数字以及大小写字母)
sed 's#[^0-9a-zA-Z]##g' 1.txt
==============================================================
把test.txt中第一个单词和最后一个单词调换位置
把test.txt中出现的第一个数字和最后一个单词替换位置
把test.txt 中第一个数字移动到行末尾
==============================================================
在test.txt 20行到末行最前面加 'aaa:'
sed -r '20,$s#(^.*$)#aaa:\1#g' 1.txt (^.*$)表示一整行,\1表示(^.*$)
==================
sed -r '20,$s#(^.*$)#\12#g' 1.txt 从20行开始,在每一行追加2
三. awk--- 一般查找指定段的值和匹配,{}里面的值要print, ‘’不需要print直接可以运算
截取文档中的某段 awk -F ':' '{print $1}' 1.txt
awk -F: '{print $1,$2,$3}' 1.txt
也可以使用自定义字符连接每个段 awk -F':' '{print $1"#"$2"#"$3"#"$4}' 1.txt
匹配字符或字符串 awk '/oo/' 1.txt
针对某个段匹配 awk -F ':' '$1 ~/oo/' 1.txt ~代表模糊匹配
多次匹配
awk -F ':' '/root/; $1 ~/aming/; $3 ~/50/' 1.txt
awk -F ':' '/root/ {print $1,$3}; $1 ~/test/; $3 ~/20/' 1.txt
echo -e "1\n10\n100\nx" |sort e代表可以识别\n ======
条件操作符==, >,<,!=,>=;<=
awk -F ':' '$3=="0"' 1.txt;
awk -F ':' '$3>="500"' 1.txt;
awk -F ':' '$3+0>=500' 1.txt; 强制转换为数字
awk -F ':' '$7!="/sbin/nologin"' 1.txt;
awk -F ':' '$3<$4' 1.txt ;
awk -F ':' '$3>"5" && $3<"7"' 1.txt ======
awk -F ':' '$3>"5" || $7=="/bin/bash"' 1.txt
awk内置变量 NF(有几段) NR(第几数)
head -n3 1.txt | awk -F ':' '{print NF}'
head -n3 1.txt | awk -F ':' '{print NR}'
打印20行以后的行awk 'NR>20' 1.txt
awk -F ':' 'NR>20 && $1 ~ /ssh/' 1.txt =====
更改某个段的值awk -F ':' '$1="root"' 1.txt ======
数学计算, 把第三段和第四段值相加,并赋予第七段
awk -F ':' '{$7=$3+$4; print $0}' 1.txt ===$0是整行的意思
可以这样子写 awk -F ':' '$7=$3+$4’ 1.txt
计算第三段的总和 awk -F ':' '{(tot=tot+$3)}; END {print tot}' 1.txt
awk中也可以使用if关键词 awk -F ':' '{if ($1=="root") print $0}' 1.txt
$0代表整体
用外边的变量:
a=3; awk -F: '$3="'$a'"' 1.txt ============
awk练习题
用awk 打印整个test.txt (以下操作都是用awk工具实现,针对test.txt)
awk '{print $0}' 1.txt
查找所有包含 'bash' 的行
用 ':' 作为分隔符,查找第三段等于0的行 awk -F: '$3==0 {print $0}' 1.txt
用 ':' 作为分隔符,查找第一段为 'root' 的行,并把该段的 'root' 换成 'toor' (可以连同sed一起使用)
awk -F: '$1=="root" && $1="toor"' 1.txt ====
awk -F: '$1=="root" && $1="toor"{OFS=":" ;print}' 1.txt OFS是内置的一个变量
用 ':' 作为分隔符,打印最后一段 !!!!!
awk -F ':' '{print $NF}' 1.txt
打印行数大于20的所有行 awk 'NR>20' 1.txt
用 ':' 作为分隔符,打印所有第三段小于第四段的行
awk -F ':' '$3<$4' 1.txt
用 ':' 作为分隔符,打印第一段以及最后一段,并且中间用 '@' 连接 (例如,第一行应该是这样的形式 'root@/bin/bash' )
awk -F: '{print $1"@"$NF}' 1.txt |head -n3
awk -F: '{OFS="@" ;print $1,$7}' 1.txt
用 ':' 作为分隔符,把整个文档的第四段相加,求和
awk -F ':' '{(tot=tot+$4)}; END {print tot}' 1.txt