文本处理工具sed
处理文本的工具sed
行编辑器 ,默认自带循环。
sed是一种流编辑器,它一次处理一行内容。
功能:主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等
sed工具
用法: sed [option]... 'script' inputfile...
常用选项:
-n:不输出模式空间内容到屏幕,即不自动打印
-e: 多点编辑
-f: 从指定文件中读取编辑脚本
-r: 支持使用扩展正则表达式
-i.bak: 备份文件并原处编辑
地址定界:
(1) 不给地址:对全文进行处理
(2) 单地址: #: 指定的行,$:最后一行 /pattern/:被此处模式所能够匹配到的每一行
(3) 地址范围:
#,#
#,+#
/pat1/,/pat2/
#,/pat1/
(4) ~:步进
1~2 奇数行
2~2 偶数行
编辑命令:
d: 删除模式空间匹配的行,并立即启用下一轮循环
p:打印当前模式空间内容,追加到默认输出之
a:在指定行后面追加文本 支持使用\n实现多行追加
i:在行前面插入文本
c :替换行为单行或多行文本
w /path/somefile: 保存模式匹配的行至指定文件
r /path/somefile:读取指定文件的文本至模式空间中 匹配到的行后
=: 为模式空间中的行打印行号
!:模式空间中匹配行取反处理
s///:查找替换,支持使用其它分隔符,s@@@,s###
替换标记:
g: 行内全局替换
p: 显示替换成功的行
w /PATH/TO/SOMEFILE:将替换成功的行保存至文件中
示例:
sed -n '2p' /etc/passwd 只打印/etc/passwd下匹配到的第二行
sed –n ‘1,4p’ /etc/passwd 只打印/etc/passwd下匹配到的第二行到第四行
nl /etc/passwd | sed ‘2,5d’ 删除/etc/passwd中的2到5行
高级编辑命令
P:打印模式空间开端至\n内容,并追加到默认输出之前
h: 把模式空间中的内容覆盖至保持空间中
H:把模式空间中的内容追加至保持空间中
g: 从保持空间取出数据覆盖至模式空间
G:从保持空间取出内容追加至模式空间
x: 把模式空间中的内容与保持空间中的内容进行互换
n: 读取匹配到的行的下一行覆盖至模式空间
N:读取匹配到的行的下一行追加至模式空间
d: 删除模式空间中的行
D:如果模式空间包含换行符,则删除直到第一个换行符的模式空间中的文本, 并不会读取新的输入行,而使用合成的模式空间重新启动循环。如果模式空间 不包含换行符,则会像发出d命令那样启动正常的新循环
实例:
sed -n 'n;p' file (sed -n '2~2p' file) 打印文件偶数行
sed '1!G;h;$!d' file (tac file) 把文件内容倒序排
练习:
1、删除centos7系统/etc/grub2.cfg文件中所有以空白开头的行行首的空白字符
sed -r 's/^[[:space:]]\+//' /etc/greb2.cfg
2、删除/etc/fstab文件中所有以#开头,后面至少跟一个空白字符的行的行首的# 和空白字符
sed -r 's/^#[[:space:]]\+//' /etc/fstab
3、在centos6系统/root/install.log每一行行首增加#号
sed 's/^/#/' /root/install.log
4、在/etc/fstab文件中不以#开头的行的行首增加#号
sed -r 's/(^[^#.*])/#\1/'/etc/fstab
5、处理/etc/fstab路径,使用sed命令取出其目录名和基名
echo /etc/fstab | sed -r 's@(.*/)([^/]+/?$)@\1@'
echo /etc/fstab | sed -r 's@(.*/)([^/]+/?$)@\2@'
6、利用sed 取出ifconfig命令中本机的IPv4地址
ifconfig ens33| sed -n '2p' | sed -r 's@.*inet(.*)net.*@\1@'
ifconfig ens33| sed -n '2p' | sed -r 's@.*inet (.*)net.*@\1@'
ifconfig ens33| sed -n '2p' | sed -r 's@.*inet (.*) net.*@\1@'
ifconfig ens33| sed -n '2p' | sed -r 's@(.*inet )(.*)( net.*)@\2@'
ifconfig ens33| sed -r '2!d;s@(.*inet )(.*)( net.*)@\2@'
ifconfig ens33|sed -n '2p' |sed 's/.*inet //' |sed 's/ netmask.*//'
ifconfig ens33|sed -n '2p' |sed -e 's/.*inet //' -e 's/ netmask.*//'
7、统计centos安装光盘中Package目录下的所有rpm文件的以.分隔倒数第二个 字段的重复次数
ls | sed -r 's/(.*\.)(.*)(\.rpm)/\2/' |sort |uniq -c
ls *.rpm |rev |cut -d. -f2 |rev |sort |uniq -c
8、统计/etc/init.d/functions文件中每个单词的出现次数,并排序(用grep和 sed两种方法分别实现)
cat /etc/init.d/functions |sed -r 's/[^[:alpha:]]/\n/g' |sort |uniq -c | sort -nr
cat /etc/init.d/functions | egrep -o "\<[[:alpha:]]+\>" | sort | uniq -c | sort -nr
9、将文本文件的n和n+1行合并为一行,n为奇数行
sed 'N;s/\n//' f1