大多数人终生追逐的那些希望和努力是毫无价值的。每个人只是因为有个胃,就注定要参与这种追逐。而且由于参与这种追逐,他的胃是可能得到满足的,但是,一个有思想、有感情的人却不能由此得到满足。——爱因斯坦

Perl文件处理示例——批量添加Copyright版权信息

对所有输入文件,如果没有版权信息则加上版权信息,否则什么都不做,并对原文件以.bak结尾备份。

开始我使用如下程序(尝试前千万先备份输入的文件):

#!usr/bin/perl -w
$^I = ".bak";
my %do_these;

foreach (@ARGV){
print $_;
$do_these{$_} = 1;
}

while(<>){
if(/^## Copyright/){
delete $do_these{$ARGV};
}
}

@ARGV = sort keys %do_these;
while(<>){
if(/^#!/){
$_ .= "## Copyright (C) 2011 by yujianjun";
}
print;
}

结果:原文件和备份文件全部空白,真是糟糕。(切记以后测试程序时,要做好备份)。
分析原因:

主要是由于$^I使用错误。先来看看关于$^I的运作原理:

$^I 默认值undef,这不会影响程序。如果将其赋值为某个字符串(如程序中的".bak"),程序将执行备份操作,并将该字符串添加到原文件名后面,成为备份文件名的拓展名。使用钻石操作符打开文件时,perl的操作是,先将打开的文件名改成加了拓展名的文件名,然后再新建一个原来的文件名的文件,然后在程序一行行读入文件内容并做一些改动后,会保存到新文件中去。这样就相当于修改了文件内容,并将老文件进行了备份。当然,如果值是undef,则不会备份旧文件。

由于上面程序中将$^I = ".bak";放在最前面,但后面有两次读取文件操作。假设读入文件为file.pl,第一次while(<>)将原文件变成了file.pl.bak。然后新建一个空文件命名为file.pl;但新文件只有程序结束的时候才会写入磁盘中,所以接下来第二次读取文件操作while(<>)时,将会把空白的file.pl变成file.pl.bak,这样就覆盖了第一次的备份文件,然后再新建一个新的空白文件file.pl,此时,包括原文件和备份文件内容都是空白。

理解了$^I的工作原理,程序就很容易修改了:

只需将$^I = ".bak";放到最后一个文件读取操作while(<>)之前就好了,如下:

 1 #!usr/bin/perl -w
2
3 my %do_these;
4 @ARGV = ("sinx.pl","nvidia.pl","changeName.pl");
5
6 foreach (@ARGV){
7 print $_;
8 $do_these{$_} = 1;
9 }
10
11 while(<>){
12 if(/^## Copyright/){
13 delete $do_these{$ARGV};
14 }
15 }
16
17 @ARGV = sort keys %do_these;
18 $^I = ".bak";
19 while(<>){
20 if(/^#!/){
21 $_ .= "## Copyright (C) 2011 by yujianjun";
22 }
23 print;
24 }



posted @ 2012-02-11 16:04  东去春来  阅读(1185)  评论(0编辑  收藏  举报