正则表达式 grep与sed的文本处理

一：整理正则表达式

正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。它由一些普通字符和一些元字符（metacharacters）组成。普通字符包括大小写的字母和数字，而元字符则具有特殊的含义。

主要常用的有：

元字符	功能	元字符	功能
^	匹配字符串的开始位置	$	匹配字符串的结束位置
.	匹配任意单个字符	*	匹配子表达式0次或n次
+	匹配子表达式一次或n次	{n}	匹配n次
{n，}	至少匹配n次	{n,m}	匹配n-m次
？	匹配子表达式一次或0次	（）	将括号里面的表达式定义为组
[xyz]	匹配xyz任意一个字符	[a-Z]	匹配指定字符范围的任意一个
[^a-Z]	匹配不在范围的任意字符	\|	或

二：grep使用（正则表达式及字符处理）

目标文件/etc/passwd,使用grep命令或egrep

1．显示出所有含有root的行：

2．输出任何包含bash的所有行，还要输出紧接着这行的上下各两行的内容：

3. 显示出有多少行含有nologin。

4．显示出那些行含有root，并将行号一块输出。

5．显示出文件中

6．新建用户

abominable

abominate

anomie

atomize

编写正则表达式，将他们匹配出来

7．建四个用户

Alex213sb

Wpq2222b

yH438PIG

egon666

egon

过滤出用户名组成是字母+数字+字母的行

8．显示出/etc目录下所有包含root的文件名

9. 过滤掉/etc/ssh/sshd_config内所有注释和所有空行

三：Sed使用：以/etc/passwd文件为模板

1，删除文件每行的第一个字符。

2，删除文件每行的第二个字符。

3，删除文件每行的最后一个字符。

4，删除文件每行的倒数第二个字符。

5，删除文件每行的第二个单词。

6，删除文件每行的倒数第二个单词。

7，删除文件每行的最后一个单词。

8，交换每行的第一个字符和第二个字符。

9，交换每行的第一个字符和第二个单词。

10，交换每行的第一个单词和最后一个单词。

11，删除一个文件中所有的数字。

12，删除每行开头的所有空格。

13，用制表符替换文件中出现的所有空格。

14，把所有大写字母用括号（）括起来。

15，打印每行3次。

16，只显示每行的第一个单词。

17，打印每行的第一个单词和第三个单词。

18，用命令获取格式为 mm/yy/dd 的日期格式，结合管道，将其换成 mm；yy；dd格式

posted @ 2017-03-22 22:26 加油头头阅读(2849) 评论(0) 收藏举报

刷新页面返回顶部