linux文本三剑客之sed命令详解
linux文本三剑客之sed命令详解
1.sed命令详解
sed称为流编辑器,处理流程如下:
- 一次处理一行内容,把当前处理的行缓存在临时缓存区中,称为“模式空间”,用sed命令处理缓存区的内容,处理完成后,把缓冲区的内容送往屏幕。sed默认不会修改源文件数据。
- 当一行数据匹配完成后,它会继续读取下一行数据,并重复这个过程,直到将文件中所有数据处理完毕。
sed命令的语法结构如下:
sed [OPTION]... {script} [input-file]...
{script}:为地址命令
sed命令的选项如下:
选项 | 说明 |
---|---|
-n | 默认情况下,sed 会在所有的脚本执行完毕后,会自动输出处理后的内容,而该选项会屏蔽自动输出,需使用 p 命令来完成输出。 |
-e | 多点编辑,逻辑与,需同时匹配前后两者内容才会输出 |
-f | 从指定文件中读取编辑文件 |
-r | 支持使用扩展正则表达式,默认支持标准正则表达式 |
-i | 此选项会直接修改源文件 |
1.1 地址定界和编辑命令
-
地址定界
地址定界符 说明 不给地址 默认进行全文处理 # 指定的#行 $ 最后一行 /pattern/ 被此模式匹配到的每一行 m,n 从第m行到第n行 m,+n 从第m行到m+n行 /pat1/,/pat2/ 从模式1的行到模式2的行 m,/pat1/ 从第m行到被模式1匹配的行 ~ 步进 -
编辑命令
命令 选项 d 删除模式空间的行,并开启下一行 p 打印当前模式匹配的行,追加到指定行之后 a [\]text 在指定的行后面追加文本,\用于读特殊符号转义,\n换行实现多行文本追加 i [\]text 在指定的行之前追加文本 c [\]text 把指定的行替换为text文本 w FILE 保存模式匹配的行到FILE文件 r FILE 读取指定文件的行到模式空间中,匹配到指定行后 ! 模式空间的行取反处理 = 为模式空间的行打印行号 sed用法示例如下:
#示例一:sed默认会对没有处理的行自动打印,对要处理的行再次处理一次 [root@xuzhichao ~]# seq 1 5 | sed '2p' 1 2 2 3 4 5 #示例二:-n选项,会把没有处理的内容不输出到屏幕 [root@xuzhichao ~]# seq 1 5 | sed -n '2p' 2 #示例三:sed的地址定界功能 [root@xuzhichao ~]# sed -n '/^root/,/^bin/p' /etc/passwd root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin rooter:x:1002:1002::/home/rooter:/bin/bash [root@xuzhichao ~]# sed -n '/^root\>/,/^bin/p' /etc/passwd root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin #示例四:sed的地址定界功能 [root@xuzhichao ~]# sed -n '2p' /etc/passwd bin:x:1:1:bin:/bin:/sbin/nologin [root@xuzhichao ~]# sed -n '2,3p' /etc/passwd bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin [root@xuzhichao ~]# sed -n '2,+1p' /etc/passwd bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin [root@xuzhichao ~]# sed -n '/^root\>/,3p' /etc/passwd root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin #示例五:打印奇数行和偶数行 [root@xuzhichao ~]# seq 6 | sed -n '1~2p' 1 3 5 [root@xuzhichao ~]# seq 6 | sed -n '2~2p' 2 4 6 #示例六:-e选项,同时实现多个选项 [root@xuzhichao ~]# seq 5 | sed -n -e '2p' -e '4p' 2 4 #示例七:d选项,删除,不加地址定界会删除全部内容,与-n选项合用也会删除全部内容 [root@xuzhichao ~]# seq 5 | sed 'd' [root@xuzhichao ~]# seq 5 | sed -n '4d' [root@xuzhichao ~]# seq 5 | sed '1,4d' 2 3 5 #示例八:!的取反功能 [root@xuzhichao ~]# seq 5 | sed -n '4!p' 1 2 3 5 [root@xuzhichao ~]# seq 5 | sed '4!d' 4 #示例九:显示行号 [root@xuzhichao ~]# sed -n '/root/=' /etc/passwd 1 10 39 40 [root@xuzhichao ~]# sed -n -e '/root/=' -e '/root/p' /etc/passwd 1 root:x:0:0:root:/root:/bin/bash 10 operator:x:11:0:operator:/root:/sbin/nologin 39 admroot:x:1001:1001::/home/admroot:/bin/bash 40 rooter:x:1002:1002::/home/rooter:/bin/bash #示例十:a选项追加内容 [root@xuzhichao ~]# seq 5 | sed '2,4a\ =======\n\ =======' 1 2 ======= <==空格后跟多个等号= ======= 3 ======= ======= 4 ======= ======= 5 #示例十一:a追加的用法:在~/.bashrc文件中增加两个别名项。 [root@xuzhichao ~]# cat ~/.bashrc # .bashrc # User specific aliases and functions alias rm='rm -i' alias cp='cp -i' alias mv='mv -i' # Source global definitions if [ -f /etc/bashrc ]; then . /etc/bashrc fi [root@xuzhichao ~]# sed '/specific/aalias cdnet="cd /etc/sysconfig/network-scripts/"\nalias p=poweroff' ~/.bashrc # .bashrc # User specific aliases and functions alias cdnet="cd /etc/sysconfig/network-scripts/" alias p=poweroff alias rm='rm -i' alias cp='cp -i' alias mv='mv -i' # Source global definitions if [ -f /etc/bashrc ]; then . /etc/bashrc fi #示例十二:i选项用于在指定行前面增加内容 [root@xuzhichao ~]# seq 5 | sed '2iabc\nefg' 1 abc efg 2 3 4 5 #示例十三:c选项用于替换指定行的内容 [root@xuzhichao ~]# seq 5 | sed '1,2cabc\nefg' abc efg 3 4 5 #示例十四:w选项可以保存指定行到一个文件中 [root@xuzhichao ~]# seq 5 | sed -n '2,4wf1' [root@xuzhichao ~]# cat f1 2 3 4 #示例十五:r选项可以读取指定的文件内容追加到指定的行后 [root@xuzhichao ~]# cat f2 1 2 3 [root@xuzhichao ~]# seq 4 6 | sed '3r f2' 4 5 6 1 2 3 #示例十六:-i选项可以直接修改原始文件,-i.bak可以先备份原始文件,然后再修改原始文件 [root@xuzhichao ~]# cat f2 1 2 3 [root@xuzhichao ~]# sed -i '2aabc' f2 [root@xuzhichao ~]# cat f2 1 2 abc 3 [root@xuzhichao ~]# sed -i.bak '2aabc' f2 [root@xuzhichao ~]# cat f2 1 2 abc abc 3 [root@xuzhichao ~]# cat f2.bak 1 2 abc 3
1.2 搜索替换
sed可以实现搜素替换功能,比较常用,命令格式为:
[address]s/pattern/replacement/flags
[address]:代表地址定界;
pattern:指的是需要替换的内容,支持正则表达式;
replacement:指的是要替换的新内容,支持后向引用;
其中/可以换为@或#,即s@@@或s###;
常用的flags意义如下:
flags | 说明, |
---|---|
g | 对一行中的数据匹配到的内容全部进行替换,如果没有 g,则只会对匹配到的第一个数据做替换操作。 |
p | 打印替换命令中被pattern模式匹配到的行,此标记通常与 -n 选项一起使用 |
n | 1~512 之间的数字,表示要替换第几次被模式匹配到的字符串,例如,一行中有 3 个 A,但用户只想替换第二个 A,则n为2 |
w file | 将缓冲区中的内容写到指定的 file 文件中 |
& | 后向引用,表示对[address]s/pattern/replacement/flags中的pattern匹配的内容进行引用 |
\n | 后向引用,表示对pattern中的内容匹配的第 n 个小括号分组匹配中的内容进行引用。 |
\ | 用于转义特殊字符 |
sed搜索替换相关的使用示例如下:
#示例一:sed的搜索替换如果不加flag,默认只对一行中匹配的地址pattern进行替换;
#使用数字n可以指定对第n个匹配到的pattern进行替换;
#使用g会对所有匹配到的pattern进行替换;
[root@xuzhichao ~]# echo "root root root" | sed 's/root/admin/'
admin root root
[root@xuzhichao ~]# echo "root root root" | sed 's/root/admin/2'
root admin root
[root@xuzhichao ~]# echo "root root root" | sed 's/root/admin/g'
admin admin admin
#示例二:w选项,会把匹配到的行写入文件中;
#注意:仅仅会把pattern匹配到的行写入文件中,而且是被替换之后;
[root@xuzhichao ~]# seq 5 | sed -n 's/1/11/w f1'
[root@xuzhichao ~]# cat f1
11
#示例三:&的应用:不需要使用分组(),会对pattern匹配到的所有内容进行引用
[root@xuzhichao ~]# echo "root root root" | sed 's/root/&er/g'
rooter rooter rooter
#示例四:把/etc/default/grub的第六行之后增加single单用户模式
[root@xuzhichao ~]# cat /etc/default/grub
GRUB_TIMEOUT=5
GRUB_DISTRIBUTOR="$(sed 's, release .*$,,g' /etc/system-release)"
GRUB_DEFAULT=saved
GRUB_DISABLE_SUBMENU=true
GRUB_TERMINAL_OUTPUT="console"
GRUB_CMDLINE_LINUX="crashkernel=auto spectre_v2=retpoline rd.lvm.lv=centos/root rd.lvm.lv=centos/swap rhgb quiet net.ifnames=0"
GRUB_DISABLE_RECOVERY="true"
[root@xuzhichao ~]# sed '/GRUB_CMDLINE_LINUX/s/"$/ single&/' /etc/default/grub
GRUB_TIMEOUT=5
GRUB_DISTRIBUTOR="$(sed 's, release .*$,,g' /etc/system-release)"
GRUB_DEFAULT=saved
GRUB_DISABLE_SUBMENU=true
GRUB_TERMINAL_OUTPUT="console"
GRUB_CMDLINE_LINUX="crashkernel=auto spectre_v2=retpoline rd.lvm.lv=centos/root rd.lvm.lv=centos/swap rhgb quiet net.ifnames=0 single"
GRUB_DISABLE_RECOVERY="true"
#示例五:取路径的基名和文件夹名
#basename命令用于取文件路径中的文件名
#dirname命令用于取文件路径中的目录名
[root@xuzhichao ~]# echo "/etc/httpd/conf/httpd.conf" | sed -r 's@(^.*/)([^/]+/?$)@\1@'
/etc/httpd/conf/
[root@xuzhichao ~]# echo "/etc/httpd/conf/httpd.conf" | sed -r 's@(^.*/)([^/]+/?$)@\2@'
httpd.conf
[root@xuzhichao ~]# basename /etc/httpd/conf/httpd.conf
httpd.conf
[root@xuzhichao ~]# dirname /etc/httpd/conf/httpd.conf
/etc/httpd/conf
#示例六:删除/etc/grub2.cfg文件中所有以空白开头的行行首的空白字符
[root@xuzhichao ~]# sed -r 's/^[[:space:]]+(.*)/\1/' /etc/grub2.cfg
#示例七:注释/etc/fstab中的所有行
[root@xuzhichao ~]# sed -r 's/.*/#&/' /etc/fstab
[root@xuzhichao ~]# sed -r 's/^[^#]+/#&/' /etc/fstab
#示例八:把/etc/httpd/conf/httpd.conf文件中所有注释行删除,grep -v "^$"用于删除空行
[root@xuzhichao ~]# sed -r 's/^[[:space:]]*#.*//' /etc/httpd/conf/httpd.conf | grep -v "^$"
#示例九:使用sed取出ifconfig中的本机ip地址
[root@xuzhichao ~]# ifconfig eth0 | sed -r '2!d;s/.*inet (.*) netmask.*/\1/'
192.168.20.17
#示例十:对centos中光盘所有rpm包基于cpu架构(倒数第二个字段)统计并排序
[root@xuzhichao ~]# ls /misc/cd/Packages/*.rpm | tr -s ' ' '\n' | sed -r 's/^.+\.([^.]+)\.rpm$/\1/' | sort | uniq -c | sort -rn
[root@xuzhichao ~]# ls /misc/cd/Packages/*.rpm | tr -s ' ' '\n' | awk -F. '{print $(NF-1)}' | sort | uniq -c | sort -rn
[root@xuzhichao ~]# ls /misc/cd/Packages/*.rpm | tr -s ' ' '\n' | rev | cut -d. -f 2 | rev | sort | uniq -c | sort -rn
4649 x86_64
3154 noarch
2267 i686
#示例十一:统计/etc/init.d/functions中单词总数
#处理思路:单词只包括字符串中包含字母,数字,其他字符都是单词的分隔符
[root@xuzhichao ~]# cat /etc/init.d/functions | tr -s " " | sed -r 's/[^[:alnum:]]/\n/g' | wc -l
1.3 sed高级用法
sed命令在处理数据时的缓存区有模式空间和保持空间两个空间,利用这两个空间可以实现一些高级编辑功能。
sed命令的以下子命令意义如下:
命令 | 意义 |
---|---|
P | 同 d 和 D 之间的区别一样,P(大写)命令和单行打印命令 p(小写)不同,对于具有多行数据的模式空间来说,它只会打印模式空间中的第一行,也就是首个换行符之前的所有内容;p会打印模式空间的所有内容 |
h | 将模式空间中的内容复制到保持空间 |
H | 将模式空间中的内容附加到保持空间 |
g | 将保持空间中的内容复制到模式空间 |
G | 将保持空间中的内容附加到模式空间 |
x | 交换模式空间和保持空间中的内容 |
n | 读取匹配到的行的下一行覆盖至模式空间 |
N | 将匹配到的行的下一行文本内容添加到模式空间已有数据之后(之间用换行符分隔),从而使前后两个文本行同时位于模式空间中,sed 命令会将这两行数据当成一行来处理。 |
d | 删除模式空间的行,然后读取下一行继续删除 |
D | 其作用是只删除缓冲区中的第一行,即将缓冲区中第一个换行符(包括换行符)之前的内容删除掉。 |
高级用法使用示例:
#示例一:使用sed匹配2,然后把2和2的下一行3读入模式空间中,把换行符替换为空格
[root@xuzhichao ~]# seq 5 | sed '/2/{N;s/\n/ /}'
1
2 3
4
5
[root@xuzhichao ~]# seq 5 | sed '{N;s/\n/ /}'
1 2
3 4
5
#示例二:
#查找字符串2,然后把2和2的下一行3读入模式空间,在模式空间中匹配2,匹配到后把第一个换行前的内容删除
[root@xuzhichao ~]# seq 5 | sed '/2/{N;/2/D}'
1
3
4
5
#示例三:查找字符串2,然后把2和2的下一行3读入模式空间,在模式空间中匹配2,匹配到后把模式空间所有内容删除
[root@xuzhichao ~]# seq 5 | sed '/2/{N;/2/d}'
1
4
5
[root@xuzhichao ~]# seq 5 | sed '/2/{N;d}'
1
4
5
#示例四:一次读取两行到模式空间,第一读取前两行,匹配到2,删除1;第二次读取第2行和第3行,匹配到2,把2删除。
[root@xuzhichao ~]# seq 5 | sed 'N;/2/D'
3
4
5
[root@xuzhichao ~]# seq 5 | sed 'N;/3/D'
1
2
4
5
#示例五:sed命令一次读取两行,第一次读取前两行,输出换行符之前的内容,即1,然后sed自动把模式空间内容输出,接着读取第3行和第4行,依次类推。
[root@xuzhichao ~]# seq 5 | sed 'N;P'
1
1
2
3
3
4
5
[root@xuzhichao ~]# seq 5 | sed 'N;p'
1
2
1
2
3
4
3
4
5
#示例六:打印奇数行和偶数行
[root@xuzhichao ~]# seq 5 | sed 'n;d'
1
3
5
[root@xuzhichao ~]# seq 5 | sed -n 'n;p'
2
4
#示例七:倒序显示tac,实现步骤如下
#1、读取第1行内容1,1!G不匹配第一行,h把1放入保持空间,$!d把不是最后一行的模式空间内容清空,此时保持空间为1;
#2、读取第2行内容2,1!G把1追加到模式空间,h把2\n1放入保持空间,$!d把不是最后一行的模式空间内容清空,此时保持空间为2\n1;
#3、依次类推,当最后一行读入时,模式空间不会清空,直接打印出来即为倒序显示;
[root@xuzhichao ~]# seq 5 | sed '1!G;h;$!d'
5
4
3
2
1
[root@xuzhichao ~]# seq 5 | sed -n '1!G;h;$p'
5
4
3
2
1
#示例八:取最后一行
[root@xuzhichao ~]# seq 5 | sed 'N;D'
5
[root@xuzhichao ~]# seq 5 | sed '$!d'
5
#示例九:取最后两行
[root@xuzhichao ~]# seq 5 | sed '$!N;$!D'
4
5
#示例十:每行后追加空行
[root@xuzhichao ~]# seq 5 | sed 'G'
1
2
3
4
5