Aggavara

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

文件名匹配/输出重定向

文件名匹配
文件名匹配使得您不必一一写出名称,就可以指定多个文件。您将用到一些特殊的字符,称为通配符(wildcards)。
假设您想用'rm'命令删除目录下所有以字符串'.bak'结尾的文件。除了在'rm'后跟上所有文件名作为参数,您还可以用通配符'*':
rm *.bak
'*'可匹配一个或多个字符。在本例中, 您告诉 shell 将命令'rm'的参数扩展到"所有以'*.bak'结尾的文件",shell 就将扩展后的参数告诉'rm'命令。您将看到,shell 在命令执行前,就将读取并解释命令行。正是因为这个,您才可以将通配符用于 shell 命令的参数中。
让我们更进一步来认识通配符'*'。假定您有个目录,其中含文件'124.bak'、'346.bak'及'583.bak'。您想只保留文件'583.bak',可以用:
rm *4*.bak
shell 就将'*4*.bak'扩展成"所有含'4'并以'.bak'结尾的字符串"。
注意到 rm 4*.bak 无法工作,因为这匹配的是以'4'开头的文件。由于目录中没有这样的文件,shell 将这个模式扩展为空的字符串,故'rm'将返回出错信息:rm: cannot remove `4*.bak': No such file or directory
如果您想保留文件'346.bak',而删除'124.bak'和'583.bak'。这看起来有些难度, 因为被删文件的名称除了后缀其他都不同。但幸运的是,您可以用不含有来指定文件:rm *[!6].bak
这将被读为:除了以'6.bak'结尾的文件,删除其他所有以'.bak'结尾的文件。 您必须将取反号(negation sign)与取反字符(这里是 6)放到括号中,不然的话,shell 会将惊叹号(exclamation mark)解释成历史记录替换的开始(the beginning of a history substitution)。
取反号在本篇介绍的所有匹配模式中都有效。

请注意:通配符'*'与取反号连用,很容易产生问题。猜猜rm *[!6]*.bak表示什么?这个命令将删除所有文件,甚至包括名称中包含'6'的文件。如果您将通配符'*'放到了取反号前面和后面,实际上取反号将失效,因为 shell 将其解释为"所有名称中任何位置都不含该字符的文件"。在我们的例子里,只有文件'666.bak'不符合该模式。

第二个通配符是问号(question mark):'?'。在匹配时,一个问号只能代表一个字符。为了示范其用途,我们在上例的假设中添加两个新文件:'311.bak~'和'some.text'。现在, 列出所有在点号后有四个字符的文件:
ls *.????
问号通配符能够有效地避免上面提到的'取反号陷阱'(negation trap):rm *[!4]?.*
将扩展成"所有除了点号前倒数第二个字符为'4'的文件",也就是只保留文件'346.bak'。您可能会问,有没有其他匹配方式?到目前为止,您只看到了在指定位置匹配唯一字符的方法。但其实您也可以这样:
ls [13]*
将列出所有以字符'1'或'3'开头的文件;在我们的例子中,文件'124.bak'、'311.bak~'和'346.bak'匹配。注意到您必须用中括号将匹配的模式括起来,否则模式只匹配以字符串'13'开头的文件。接下来,您将高兴地看到还可以定义匹配的范围:
ls *[3-8]?.*
将列出所有点号前倒数第二个字符落在'3'到'8'范围的文件。在我们的例子中,匹配的文件是'346.bak'和'583.bak'。

引用 shell 的特殊字符
但是,上面的那些机制存在一个缺点:shell 总在命令执行前,试着进行扩展。有时候,会变得很棘手:
文件名包含特殊字符。
假设您在那个目录中还有一个名为'!56.bak'的文件。下面试图进行模式匹配:
rm !*
rm
rm: too few arguments
shell 将'!*'解释成历史记录的替换(加入前一个命令的所有参数),而不是匹配方式。

命令本身带特殊字符作参数。
一些 linux 下的命令行工具,比如 (e)grep、sed、awk、find 及 locate ,都使用自己的正则表达式(regular expressions)。这些表达式与模式匹配看起来惊人地相似, 但在某些地方又有所不同。但为了使这些特殊命令生效,shell 就不能先将其当作模式匹配来解释:
find . -name [1-9]* -print
find: paths must precede expression
应该是:
find . -name '[1-9]*' -print
./346.bak
./124.bak
./583.bak
./311.bak~

您可以通过反斜线(back slash)来引用特殊字符,比如 ! 、$ 、? 或空格:
ls !*
!56.bak
或者用(单)引号:
ls '!'*
!56.bak
请注意,要看清楚引号应该放在什么位置。命令 ls '!*' 将查找名为'!*'的文件, 这是由于通配符也在引号间,所以只能依照字面来解释。

输出重定向
Unix 的理念是汇集许多小程序,每个东东都有特殊的专长。 复杂的任务不是由大型软件完成,而是运用 shell 的机制,组合许多小程序共同完成。重定向就在其中发挥着重要的作用。

在多个命令间重定向
这要通过管道(pipe),由管道符号|来标识。语法是:command1 | command2 | command3 等等。这种格式您一定已经见到过了。管道经常将一个程序的输出送到'more'或'less'来阅读。
ls -l | less
其中,第一个命令提供目录内容,第二个则将其以翻页的方式显示。更复杂的例子如:rpm -qa | grep ^x | less
第一个命令给出所有已安装的 RPM 包,第二个则将其过滤(filter:'grep'),只剩下以'^x'开头的包,第三个命令则将结果以翻页的方式显示。

重定向至文件
有时,您希望将命令的输出结果保存到文件中,或以文件内容作为命令的参数。这可以通过'>'和'<'来实现。
command > file将 command 的输出保存到 file 中,这将覆盖 file 中的内容:
ls > dirlist
将当前目录的内容保存到'dirlist'文件。
command < file
将 file 内容作为 command 的输入:
sort < dirlist > sdirlist
将文件'dirlist'的内容送到命令'sort',然后再将排序后的结果送到文件'sdirlist'。当然,您也可以一步到位:ls | sort > sdirlist
一种特殊的方式是'command 2> file'。这将 command 执行的出错信息送到 file 中。这个您到时候会需要另一种操作符是'>>',这将输出添加到已存在的文件中:
echo "string" >> file
将 string 加到文件 file 中。这是不打开文件而完成编辑的好办法!
但是,'<'和'>'操作符都有一个重要的限制:command < file1 > file1将删除 file1 的内容,而command < file1 >> file1却可以很好地工作,将加工过的 file1 内容加回到文件中。
熟知了许多 shell 的机制后, 您可能急着想知道如何来定制环境。在后面的两篇中,您将得到这方面的启示。在最后一篇中,还有一段如何处理 shell 出错信息的常见问答(FAQ),及一些配置技巧。

posted on 2012-11-13 13:52  Aggavara  阅读(805)  评论(0编辑  收藏  举报