1.11 Linux基础(十一)-sed
1.11 Linux基础(十一)
1.11.1 处理文本的工具sed
sed是一种流编编器,它是文本处理中非常中的工具,能够完美的配合正则表达式便用,功物能不同凡响。
处理时,把当前处理的行存储在临时缓冲区中,称为”模式空间”( pattern space),接看用sed命令处理缓冲区中的内容,处理成后,把缓冲区的内容送往屏幕显示。
接着理下一行,这样不断重复,直到文件末。文件内容没有改改变,除非使用了写入的命令,将内容更新。
定址用于决定对哪些行进行编辑。地址的形式可以是数字、正则表达式、或二者的结合。如果没有指定地址,sed将处理输入文件的所有行。
1.11.2 Stream EDitor, 行编辑器
sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时 缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的 内容,处理完成后,把缓冲区的内容送往屏幕。然后读入下行,执行下一个循环。 如果没有使诸如‘D’的特殊命令,那会在两个循环之间清空模式空间,但不会清 空保留空间。这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重 定向存储输出。
功能:主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等
参考: http://www.gnu.org/software/sed/manual/sed.html
用法: sed [option] '地址定界编辑命令' inputfile
1.11.3 常用选项:
-n:不输出模式空间内容到屏幕,即不自动打印
-e: 多点编辑
-f:/PATH/SCRIPT_FILE: 从指定文件中读取编辑脚本
-r: 支持使用扩展正则表达式
-i.bak: 备份文件并原处编辑
1.11.4 地址定界:
#:#表示数字
$:$表示最后一行;
/regex/:任何能被正则表达式regex所匹配到的行(/可以换成其他符号做为边界符)
#,/regex/:从第#行开始,到第一次被regex所匹配到的行结束,中间的所有行;
#1,#2:从#1行到#2行
/regex1/,/regex2/:从第一次被/regex1/匹配到的行开始到第一次被/regex2/匹配到的行结束,中间的所有行
#,+n:从第#行开始,一直到向下的n行
first~step:指定起始行,以及步长如2~2 就是从第二行开始,每两行显示一次即偶数行2,4,6,8。1~2奇数行
1.11.5 sed编辑命令:
- d:删除模式空间匹配的行,并立即启用下一轮循环
- p:打印当前模式空间内容,追加到默认输出之后
- a []text:在指定行后面追加文本,支持使用\n实现多行追加
- i []text:在行前面插入文本
- c []text:替换行为单行或多行文本
- w /path/to/somefile:保存模式匹配的行至指定文件
- r /path/from/somefile:读取指定文件的文本至模式空间中匹配到的行后
- !:模式空间中匹配行取反处理
1.11.6 查找替换
- s///:查找替换,支持使用其它分隔符,s@@@,s###
替换标记:- g: 行内全局替换
- p: 显示替换成功的行
- w /PATH/TO/SOMEFILE:将替换成功的行保存至文件中
- sed ‘2p’ /etc/passwd 显示第2行,默认会打印所有行,第二行重复打印
- sed –n ‘2p’ /etc/passwd 只打印第二行
- sed –n ‘1,4p’ /etc/passwd 只打印第一行到第四行
- sed –n ‘/root/p’ /etc/passwd 只打印被root匹配到的行
- sed –n ‘2,/root/p’ /etc/passwd 打印从2行开始到被root匹配到的行
- sed -n ‘/^$/=’ file 显示空行行号
- sed –n –e ‘/^$/p’ –e ‘/^$/=’ file
- sed ‘/root/a\superman’ /etc/passwd 在被模式匹配到的行后添加新行superman
- sed ‘/root/i\superman’ /etc/passwd 行前
- sed ‘/root/c\superman’ /etc/passwd 用superman代替被模式匹配到的行
- sed ‘/^$/d’ file
- sed ‘1,10d’ file
- nl /etc/passwd | sed ‘2,5d’
- nl /etc/passwd | sed ‘2a tea’
- sed 's/test/mytest/g' example
- sed –n ‘s/root/&superman/p’ /etc/passwd 单词后 - sed –n ‘s/root/superman&/p’ /etc/passwd 单词前 - sed -e ‘s/dog/cat/’ -e ‘s/hi/lo/’ pets
- sed –i.bak ‘s/dog/cat/g’ pets
1.11.7 高级编辑命令
- P:打印模式空间开端至\n内容,并追加到默认输出之前
- h: 把模式空间中的内容覆盖至保持空间中
- H:把模式空间中的内容追加至保持空间中
- g: 从保持空间取出数据覆盖至模式空间
- G:从保持空间取出内容追加至模式空间
- x: 把模式空间中的内容与保持空间中的内容进行互换
- n: 读取匹配到的行的下一行覆盖至模式空间
- N:读取匹配到的行的下一行追加至模式空间
- d: 删除模式空间中的行
- D:如果模式空间包含换行符,则删除直到第一个换行符的模式空间中的文本,并不会读取新的输入行,而使用合成的模式空间重新启动循环。如果模式空间 不包含换行符,则会像发出d命令那样启动正常的新循环
练习
1、删除centos7系统/etc/grub2.cfg文件中所有以空白开头的行行首的空白字符
cat /etc/grub2.cfg |sed -r 's/^[[:space:]]+//'
2、删除/etc/fstab文件中所有以#开头,后面至少跟一个空白字符的行的行首的# 和空白字符
cat /etc/fstab |sed -r 's/^#[[:space:]]+//'
3、在centos6系统/root/install.log每一行行首增加#号
cat ./install.log |sed -r 's/^(.*)/#\1/'
4、在/etc/fstab文件中不以#开头的行的行首增加#号
cat /etc/fstab |sed -r 's/^([^#]+)/#\1/'
5、处理/etc/fstab路径,使用sed命令取出其目录名和基名
echo "/etc/fstab/sysconfig" |sed -r 's/^(.*)(\/)([^/]+\/?$)/\3/'
echo "/etc/fstab/sysconfig" |sed -r 's/^(.*)(\/)([^/]+\/?$)/\1/'
6、利用sed 取出ifconfig命令中本机的IPv4地址
ifconfig ens33|sed -nr 's/^(.* inet)(.*)( netmask.*)/\2/p'
7、统计centos安装光盘中Package目录下的所有rpm文件的以.分隔倒数第二个 字段的重复次数
ls|sed -r 's/^(.*\.)([^.]+)(\.rpm$)/\2/'|sort|uniq -c |sort -nr
8、统计/etc/init.d/functions文件中每个单词的出现次数,并排序(用grep和 sed两种方法分别实现)
cat /etc/init.d/functions|grep -oE "[[:alnum:]]+\\>" |sort |uniq -c|sort -n
cat /etc/init.d/functions|sed -r 's/[^[:alnum:]]+/ /gp'|sed -nr 's/[[:space:]]+/\n/gp'|sed '/^$/d'|sort|uniq -c|sort -n
9、将文本文件的n和n+1行合并为一行,n为奇数行
seq 1 10|sed 'N;s/\n//g'
- 用sed取出ifconfig 中的IPV4地址
[root@CentOS7 data]# ifconfig ens33 |sed
'2!d;s/^.*inet //;s/ netmask.*//'
192.168.110.131
[root@CentOS7 data]# ifconfig ens33 |sed -n '2p'|sed -e 's/^.*inet //' -e 's/ netmask.*//'
192.168.110.131
[root@CentOS7 data]# ifconfig ens33 |sed -n 's/^.*inet //pg'|sed -n 's/ netmask.*//pg'
192.168.110.131
11 将/etc/fstab 下不是#开头的,开头加上#号
cat /etc/fstab|sed -r 's/^([^#])/#\1/'
cat /etc/fstab|sed 's/^[^#]/#&/'