文本过滤涉及到以下知识:

正则表达式、find、grep、awk、sed、合并与分割(sort、uniq、join、cut、paste、split)。

正则表达式:

 

  基本元字符集及其含义:

 

匹配IP地址:

 

find:

  

示例如下:

find命令练习实例:

 

find和xargs一起使用:

 

find和grep联合使用时,find会把所有找到的条目一次性传递给grep,有多少条就开多少个进程。

grep用法:

 

示例如下:

 

grep是检索行用的。awk是检索列,sed进行字符替换。 三者经常联合使用。

grep的正则表达式模式:

 

grep原理总结:

 

 

awk命令:

 

awk有三种调用模式:

 

示例程序如下:

 

awk打印了passwd文件的第一列,-F参数表示文件中的分隔符,在本例中是冒号:,花括号里面表示打印第一列。

打印第一列和第三列,并且中间空一个制表符,如下所示:

 

打印第三列大于500的,如下:

 

 grep与awk联合使用示例:

$0代表打印一整行。

带排序的grep与awk联合使用:

其中-n代表按数字方式, -k7代表按照第7列排序。

tail代表从最后一行开始取。sort加上-r表示逆序,如下:

 

 

sed提取数据,如下:

 

其中sed表示提取第5-10行的数据,p表示打印出来。

 

sed命令:

只带一个'p'表示打印所有行,包括空行。

 

sed后的2表示从第二行开始打印,一直打印到含有bb的行,p表示打印。

打印空行,=表示第几行,如下:

 

sed中的-i表示覆盖掉原来的文件,就是会对源文件进行修改。

sed的主要两个用途:

  1、按照一个范围(第几行到第几行)提取数据

  2、sed的主要用法是编辑功能,对提取的数据进行修改、替换、删除、插入等

 

ipcs进程间通信工具,这是一个命令,可以使用man ipcs查看其具体使用方法。  

ipcrm可以删除共享内存,如下所示:

 

ipcclean脚本:

 

posted on 2018-07-28 19:15  周伯通789  阅读(307)  评论(0编辑  收藏  举报