linux 文本处理工具(sed)
文本处理工具 sed(查看修改文件)
Stream EDitor(sed),sed 是一种行编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为 "模式空间” ( pattern space ),接着用 sed 命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。然后读入下行,执行下一个循环。如果没有使诸如 'D' 的特殊命令,那会在两个循环之间清空模式空间,但不会清空保留空间。这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。
功能:主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等。
参考:http://www.gnu.org/software/sed/manual/sed.html
sed [option]… 'script' inputfile… [option]
-n:不输出模式空间内容到屏幕,即不自动打印 -e:多点编辑 -f:/PATH/SCRIPT_FILE:从指定文件中读取编辑脚本 -r:支持使用扩展正则表达式 -i.bak:备份文件并原处编辑 script:地址命令 地址定界: 1> 不给地址:对全文进行处理 2> 单地址: #:指定的行,$:最后一行 /pattern/:被此处模式所能匹配到的每一行 3> 地址范围: #,# #,+# # 10,+20 表示第 10 行到第 10+20=30 行 /pat1/,/par2/ #,/pat1/ 4> ~:步进 1~2 奇数行 # 从第一行开始每次加 2 2~2 偶数行 编辑命令: d:删除模式空间匹配的行,并立即启用下一轮循环 p:打印当前模式空间内容,追加到默认输出之后(默认打印,p 打印两边) a [\]text :在指定行后面追加文本 支持使用\n 实现多行追加 i [\]text :在行前面插入文本 c [\]text :替换行为单行或多行文本 w /path/somefile:保存模式匹配的行至指定文件 r /path/somefile :读取指定文件的文本至模式空间中 扩展正则表达式 匹配到的行后: =:为模式空间中的行打印行号 !:模式空间中匹配行取反处理
# 示例: [root@centos7 ~]#ifconfig ens32 | sed -n '2p' # sed '2p' 默认打印+指定打印第 2 行,-n 关掉默认打印 [root@centos7 ~]#sed -n '/^root/p' /etc/passwd # 搜索以 root 开头的行 root:x:0:0:root:/root:/bin/bash [root@centos7 ~]#sed -n '/^b/,/^m/p' /etc/passwd # 打印以 b 开头到以 m 开头的行 [root@centos7 ~]#sed -n '1~2p' f1 # 打印 f1 文件的奇数行 [root@centos7 ~]#sed -n -e '2p' -e '6p' f1 # 打印 f1 文件的第二行和第六行 [root@centos7 ~]#sed -n -f sedscript.txt f1 # -f 后跟存储命令的文件(打印 f1文件的偶数行)
p:打印 d:删除 !:取反 =显示行号 [root@centos7 ~]#sed '2d' f1 sed '2!d' f1 # 删除第二行 删除除第二行外的行 [root@centos7 ~]#sed -n '/root/=' /etc/passwd # 显示匹配行的行号
a#:追加#号在匹配行后 [root@centos7 ~]#sed '/alias/aalias p=poweroff' .bashrc # 并没有真正改掉 [root@centos7 ~]#sed -i.bak '/alias/aalias p=poweroff' .bashrc # -i 备份并更改文件 [root@centos7 ~]#sed -i.bak2 '/alias/aalias cdnet="cd /etc/sysconfig/network-scripts/"' .bashrc
a\ XXX # 斜线表示开始 i\ # 在匹配行前面一行加 c\ # 替换匹配行 sed '2,5w f2' f1 # 将第二行到第五行追加到 f2 文件中 r # 将指定文件读入该文件 s/// # 搜索替代,支持使用其他分隔符,s@@@,s###
分组后项引用!强大 替换标记: g:行内全局替换 p:显示替换成功的行 w /PATH/TO/SOMEFILE:将替换成功的行保存至文件中
例:/etc/default/grub 解决 centos6 和 centos7 的网卡名不一样的问题(使用 sed 解决) sed 搜索替换中也支持变量用三引号’’’$X’’’引起来调用或者把 sed ''单引号变成"" sed -n 's/root/&superman/p' /etc/passwd # &表示搜索匹配到的内容
取 IP 地址: [root@centos7 ~]#ifconfig ens32 | sed -n '2p' | sed -r 's/.*inet //' | sed -r 's/ netmask.*//' 192.168.129.128 [root@centos7 ~]#ifconfig ens32 | sed -n '2p' | sed -r 's/(.*inet )(.*)( net.*)/\2/' 192.168.129.128[root@centos7 ~]#ifconfig ens32 | sed -r '2!d;s/(.*inet )(.*)( net.*)/\2/' 192.168.129.128
ifconfig | sed -nr '2s/(^[^0-9]+)([0-9.]+)( .*$)/\2/p' //支持 centos6、7 ifconfig | sed -n '2p' | sed -r 's/(^[^0-9]+)([0-9.]+)( .*$)/\2/' //支持 centos6、7
取基名、文件名: [root@centos7 ~]#echo "/etc/sysconfig/network/" | sed -r 's/(.*\/)([^/]+\/?$)/\1/' //2 文件名
高级编辑命令:(模式空间、保持空间)
P:打印模式空间开端至\n 内容,并追加到默认输出之前
h:把模式空间中的内容覆盖至保持空间中
H:把模式空间中的内容追加至保持空间中
g:从保持空间取出数据覆盖至模式空间
G:从保持空间取出内容追加至模式空间
x:把模式空间中的内容与保持空间中的内容进行互换
n:读取匹配到的行的下一行覆盖至模式空间
N:读取匹配到的行的下一行追加至模式空间
d:删除模式空间中的行
D:如果模式空间包含换行符,则删除直到第一个换行符的模式空间中的文本,并会读取新的输入行,而使用合成的模式空间重新启动循环。如果模式空间不包含换行符,则会像发出 d 命令那样启动正常的新循环。
示例: seq 10 | sed -n 'n;p' seq 10 | sed '1!G;h;$!d' seq 10 | sed 'N;D' seq 10 | sed '$!N;$!D' seq 10 | sed '$!d' seq 10 | sed 'G' seq 10 | sed 'g' seq 10 | sed '/^$/d;G' seq 10 | sed 'n;d' seq 10 | sed -n '1!G;h;$p'