Linux文档内容查询命令
grep、fgrep和egrep命令
这组命令以指定模式搜索文档,并通知用户在什么文档中搜索到和指定的模式匹配的字符串,并打印出任何包含该字符串的文本行,在该文本行的最前面是该行所在的文档名。grep命令一次只能搜索一个指定的模式;egrep命令检索扩展的正则表达式(包括表达式组和可选项);fgrep命令检索固定字符串,他不识别正则表达式,是快速搜索命令。
这组命令在搜索和定位文档中特定的主题方面很有用。要搜索的模式能够被认为是一些关键词,您能够用他们来搜索文档中包含的这些关键词。编写程式时,能够用他来寻找某一个函数,或是相关的词组。grep命令的搜索功能比fgrep强大,因为grep命令的搜索模式能够是正则表达式,而fgrep却不能。有关正则表达式请参见shell一章。
该组命令中的每一个命令都有一组选项,利用这些选项能够改变其输出方式。例如,能够在搜索到的文本行上加入行号,或只输出文本行的行号,或输出任何和搜索模式不匹配的文本行,或只简单地输出已搜索到指定模式的文档名,并且能够指定在查找模式时忽略大小写。
这组命令在指定的输入文档中查找和模式匹配的行。假如没有指定文档,则从标准输入中读取。正常情况下,每个匹配的行被显示到标准输出。假如要查找的文档是多个,则在每一行输出之前加上文档名。
语法:
grep [选项] [查找模式] [文档名1,文档名2,……]
egrep [选项] [查找模式] [文档名1,文档名2,……]
fgrep [选项] [查找模式] [文档名1,文档名2,……]
这组命令各选项的含义为:
- E 每个模式作为一个扩展的正则表达式对待。
- F 每个模式作为一组固定字符串对待(以新行分隔),而不作为正则表达式。
- b在输出的每一行前显示包含匹配字符串的行在文档中的字节偏移量。
- c 只显示匹配行的数量。
- i 比较时不区分大小写。
- h 在查找多个文档时,指示grep不要将文档名加入到输出之前。
- l 显示首次匹配串所在的文档名并用换行符将其隔开。当在某文档中多次出现匹配串时,不重复显示此文档名。
- n 在输出前加上匹配串所在行的行号(文档首行行号为1)。
- v 只显示不包含匹配串的行。
- x 只显示整行严格匹配的行。
- e expression 指定检索使用的模式。用于防止以“-”开头的模式被解释为命令选项。
- f expfile 从expfile文档中获取要搜索的模式,一个模式占一行。
对该组命令的使用还需注意以下方面:
在命令后键入搜索的模式,再键入要搜索的文档。其中,文档名列表中也能够使用特别字符,如“*”等,用来生成文档名列表。假如想在搜索的模式中包含有空格的字符串,能够用单引号把要搜索的模式括起来,用来表明搜索的模式是由包含空格的字符串组成。否则,Shell将把空格认为是命令行参数的定界符,而grep命令将把搜索模式中的单词解释为文档名列表中的一部分。在下面的例子中,grep命令在文档example中搜索模式“text file”。
$ grep ’text file’ example
用户能够在命令行上用Shell特别字符来生成将要搜索的文档名列表。在下面的例子中,特别字符“*”用来生成一个文档名列表,该列表包含当前目录下任何的文档。该命令将搜索出当前目录下任何文档中和模式匹配的行。
$ grep data *
特别字符在搜索一组指定的文档时很有用。例如,假如想搜索任何的C程式源文档中特定的模式,您能够用“*.c”来指定文档名列表。假设用户的 C程式中包含一些不必要的转向语句(goto语句),想要找到这些语句,能够用如下的命令来搜索并显示任何包含goto语句的代码行:
$ grep goto *.c
用户能够在命令行上键入搜索模式,也能够使用-f选项从指定文档中读取要搜索的模式。在文档中,每个搜索模式占一行。假如经常要搜索一组常见字符串时,这个功能很有用。在下面的例子中,用户要在文档exam中搜索字符串“editor”和“create”,就把要搜索的模式放置在文档mypats中,然后,grep命令从文档mypats中读取要搜索的模式。
$ grep -r 'xx' *
该命令遍历查找当前目录 含有XX 的内容
$ cat mypats
editor
create
$ grep -f mypats exam
文档查找命令
find命令
功能:在目录结构中搜索文档,并执行指定的操作。此命令提供了相当多的查找条件,功能很强大。
语法:find 起始目录 寻找条件 操作
说明:find命令从指定的起始目录开始,递归地搜索其各个子目录,查找满足寻找条件的文档并对之采取相关的操作。
该命令提供的寻找条件能够是个用逻辑运算符not、and、or组成的复合条件。逻辑运算符and、or、not的含义为:
(1)and:逻辑和,在命令中用“-a”表示,是系统缺省的选项,表示只有当所给的条件都满足时,寻找条件才算满足。例如:
$ find –name ’tmp’ –xtype c -user ’inin’
该命令寻找三个给定条件都满足的任何文档。
(2)or:逻辑或,在命令中用“-o”表示。该运算符表示只要所给的条件中有一个满足时,寻找条件就算满足。
例如:
$ find –name ’tmp’ –o –name ’mina*’
该命令查询文档名为’tmp’或是匹配’mina*’的任何文档。
(3)not:逻辑非,在命令中用“!”表示。该运算符表示查找不满足所给条件的文档。
例如:
$ find ! –name ’tmp’
该命令查询文档名不是’tmp’的任何文档。
需要说明的是:当使用很多的逻辑选项时,能够用括号把这些选项括起来。为了避免Shell本身对括号引起误解,在话号前需要加转义字符“\\”来去除括号的意义。
例:$ find \\(–name ’tmp’ –xtype c -user ’inin’ \\) 寻找条件有以下选项:
首先,下列各个选项中的n值能够有三种输入方式,假设n为20,则:
+20 表示20以后(21,22,23等)
-20 表示20以前(19,18,17等)
20 表示正好是20
1. 以名称和文档属性查找。
- name ’字串’ 查找文档名匹配所给字串的任何文档,字串内可用通配符*、?、[ ]。
- lname ’字串’ 查找文档名匹配所给字串的任何符号链接文档,字串内可用通配符*、?、[ ]。
-gid n 查找属于ID号为n的用户组的任何文档。
-uid n 查找属于ID号为n的用户的任何文档。
-group ’字串’ 查找属于用户组名为所给字串的任何的文档。
-user ’字串’ 查找属于用户名为所给字串的任何的文档。
-empty 查找大小为0的目录或文档。
-path ’字串’ 查找路径名匹配所给字串的任何文档,字串内可用通配符*、?、[ ]。
-perm 权限 查找具备指定权限的文档和目录,权限的表示能够如711,644。
-size n[bckw] 查找指定文档大小的文档,n后面的字符表示单位,缺省为b,代表512字节的块。
-type x 查找类型为x的文档,x为下列字符之一:
b 块设备文档
c 字符设备文档
d 目录文档
p 命名管道(FIFO)
f 普通文档
l 符号链接文档(symbolic links)
s socket文档
-xtype x 和-type基本相同,但只查找符号链接文档。
2. 以时间为条件查找
- amin n 查找n分钟以前被访问过的任何文档。
- atime n 查找n天以前被访问过的任何文档。
- cmin n 查找n分钟以前文档状态被修改过的任何文档。
- ctime n 查找n天以前文档状态被修改过的任何文档。
- mmin n 查找n分钟以前文档内容被修改过的任何文档。
- mtime n 查找n天以前文档内容被修改过的任何文档。
3. 可执行的操作
- exec 命令名称 {} 对符合条件的文档执行所给的Linux 命令,而不询问用户是否需要执行该命令。{}表示命令的参数即为所找到的文档;命令的末尾必须以“ \\;”结束。
- ok 命令名称 { } 对符合条件的文档执行所给的Linux 命令,和exec不同的是,他会询问用户是否需要执行该命令。
- ls 周详列出所找到的任何文档。
- fprintf 文档名 将找到的文档名写入指定文档。
- print 在标准输出设备上显示查找出的文档名。
- printf 格式 格式的写法请参考有关C语言的书。
例1:查找当前目录中任何以main开头的文档,并显示这些文档的内容。
$ find . - name ‘main*’ - exec more {} \\;
例2:删除当前目录下任何一周之内没有被访问过的a .out或*.o文档。
$ find . \\(- name a.out - o - name ‘*.o’\\)\\
> - atime +7 - exec rm {} \\;
说明如下: 命令中的“.”表示当前目录,此时find将从当前目录开始,逐个在其子目录中查找满足后面指定条件的文档。\\(和\\)表示括号(),其中的“\\”称为转义符。之所以这样写是由于对Shell而言,(和)另有不同的含义,而不是这里的用于组合条件的用途。“- name a.out”是指要查找名为a.out的文档;“- name ‘*.o’”是指要查找任何名字以 .o结尾的文档。这两个- name之间的- o表示逻辑或(or),即查找名字为a.out或名字以 .o结尾的文档,find在当前目录及其子目录下找到这佯的文档之后,再进行判断,看其最后访问时间是否在7天以前(条件-atime +7),若是,则对该文档执行命令rm(- exec rm{ }\\;)。其中{ }代表当前查到的符合条件的文档名,\\;则是语法所需要的。上述命令中第一行的最后一个\\是续行符。当命令太长而在一行写不下时,可输入一个\\,之后系统将显示一个>,指示用户继续输入命令。
locate命令
locate命令用于查找文档,他比find命令的搜索速度快,他需要一个数据库,这个数据库由每天的例行工作(crontab)程式来建立。当我们建立好这个数据库后,就能够方便地来搜寻所需文档了。
该命令的一般形式为:
locate 相关字
例如:查找相关字issue
$ locate issue
/etc/issue
/etc/issue.net
/usr/man/man5/issue.5
/usr/man/man5/issue.net.5 。