Perl 命令行一句话代码 翻译+总结

编辑/整理:523066680@163.com
首发:[连载]Perl 命令行一句话代码,翻译+整理

序:内容取自 《Perl One-Liners》,注意该教程中示例的 ' 符号(单引号)在windows 中应改为双引号,否则不会奏效。我在翻译和摘录的代码中也会改用双引号

备注:

  1. 不做全文翻译,尽量简明
  2. 假设看官已经有正则表达式基础
  3. 环境:Win7, Strawberry Perl 5.24 Portable Edition

Chapter 1 - Perl ONE-LINERS

第一个示例,全局将文件中的 you 替换为 me:

perl -pi -e "s/you/me/g" file

/g 表示全局替换
-e 参数允许执行 Perl 代码
-p 参数确保处理文本的每一行并且将处理后的结果打印出来
-i 参数将修改的结果应用到文件中(所以看不到 -p 打印的内容了)
-i[extension] edit <> files in place (makes backup if extension supplied)

注意,实际测试 -i 参数必须提供扩展名以备份文件,否则提示:Can't do inplace edit without backup.
perl -pi.bak -e "s/you/me/g" file

处理多个文件:

perl -pi.bak -e "s/you/me/g" file1 file2 file3

仅处理含有"we"的行:

perl -pi.bak -e "s/you/me/g if /we/" file

打印文件中重复出现的行:

perl -ne "print if $a{$_}++" file

$_ 表示当前遍历的行的内容
-n 表示遍历所有行(类似 -p 但不负责打印结果)

执行后将自动建立字典 %a,当 $_ 对应的值第一次出现的时候,$a{$_} 还是 undef(同0),+1在下次生效。再次出现时为1,打印输出,以此类推。

添加并打印行号:

perl -ne "print \"$. $_\"" file

在 Perl 中,$. 是一个特殊变量,表示当前行数。这个例子也可以改用 -p
perl -pe "$_ = \"$. $_\"" file

带行号,但仅显示重复行

perl -ne "print \"$. $_\" if $a{$_}++" f.txt

借用 List::Util 模块统计每行中出现的数字的和

perl -MList::Util=sum -alne 'print sum @F' f.txt

说明:
-MList::Util 导入 List::Util 模块
=sum 表示导入 List::Util 的 sum 函数
-a 参数,自动按空格划分行的内容并保存到 @F,使单词、数字独立出来
注 -F/pattern/ 参数可指定其他划分规则
-l 参数确保每一次输出都换行,省了手动 "\n"

让时间回退到 1299 天前:

perl -MPOSIX -le "@t = localtime; $t[3] -= 1299; print scalar localtime mktime @t"

实际时间:
Wed Apr 26 19:31:22 2017
输出:
Sat Oct 5 19:31:22 2013

这个过程实际就是 用 @t 获取 localtime 的返回结果(数组环境),将日期减1299(在数组成员中会变成负数),再使用 mktime 将其封装,返回给 localtime,再用标量环境打印 localtime 的返回值

如何生成8位随机字符密码?map 走起:

perl -le "print map { ('a'..'z')[rand 26] } 1..8"

1..8 产生数组数字从 1-8,关键是产生8次循环
('a'..'z') 产生数组元素a-z,而 [rand 26] 随机产生数组下标,也就是随机选取字母
map 返回每一次循环的处理结果

要我写的话可能会用 grep ,逐个 print
perl -e "grep { print (('a'..'z')[rand 26]) } (1..8)"

发现 print ('a'..'z')[rand 26] 会提示语法问题,必须外加括号。

累计文本中每行的首列数字的和

perl -lane "$sum += $F[0]; END { print $sum }" f.txt

END {} 定义了一个代码块,该代码块在脚本结束时运行

如果对 perl 的任一项参数有疑惑,可以参考
perldoc perlrun

其他参考

perldoc perlvar - 关于 Perl 的特殊变量
perldoc perlop - 操作符
perldoc perlfunc - 函数

Chapter 2 - 换行和间隔符

在每行的末尾增加空白行

perl -pe "$\=\"\n\"" f.txt

之前对 -p 和 -e 参数做过简要的说明,以上代码相当于:

while (<>) {
    $\ = "\n";
} continue {
    print or die "-p failed: $!\n";
}

构成

-p 参数建立 while (<>) {} continue { print } 循环结构
在 while 循环内默认用 $_ 存储当前读入的行,而 print 的缺省参数为 $_

-e "代码" 对应 while 循环内的代码。

continue 语句块在 while 的每次循环末尾继续执行,
特点是 continue {} 的代码不会因为 next 而跳过

特殊变量 $\ 相当于 AWK 中的 ORS 变量 (Output Record S eparator) 。
$\ 的内容将自动追加到 $_ 的末尾。循环地为 $\ 赋相同的值是不必要的,
将其放在 BEGIN 代码块可以节省开销(BEGIN代码块优先执行):
perl -pe "BEGIN { $\=\"\n\" } " f.txt

相当于:

BEGIN { $\ = "\n" }
while (<>) {
} continue {
    print or die "-p failed: $!\n";
}

其他方案

通过 "." 操作符添加换行:
perl -pe "$_ .= \"\n\"" f.txt

或者使用s///正则替换:
perl -pe 's/$/\n/' f.txt

甚至可以利用 say 操作符的特性(Perl 5.10 或以上):
perl -nE 'say' f.txt

-E 参数允许打开所有 Perl 的可选特性(为了支持 say 操作符)
-n 参数类似 -p ,遍历所有读入的行但不主动 print(前面介绍过了)
say 操作符类似 print,但 say 总是在每行的末尾添加 "\n"

最后,别忘了多用 perldoc, 执行 perldoc perlrun 查看perl命令行参数的详细说明

换行加倍,空行除外

perl -pe "$_ .= \"\n\" unless /^$/" f.txt

unless 在 perl 中是 if not 的意思
/^$/ 表示行的开头和末尾之间没有其他字符

也可以用 \S 筛选:
perl -pe "$_ .= \"\n\" if /\S/" f.txt

\s 代表一系列空白符号
\S 表示空白以外的字符
如果一行中包含空给以外的字符,则追加 \n

三倍换行符

相信各位已经能举一反三,不解释了(后面的命令行示例省去文件名部分)
perl -pe "$\ = \"\n\n\""

perl -pe "$_ .= \"\n\n\""

perl -pe "s/$/\n\n/"

N倍换行符

Perl 使用 "字符"x数字 的方式对字符串翻倍叠加,例如7个换行符:"\n"x7

在每行之前添加空行

使用正则替换向文件开头插入\n:
perl -pe 's/^/\n/'

删除空白行

perl -ne 'print unless /^$/'

由于这里要自己判断(筛选)输出,所以使用 -n 而非 -p

posted @ 2017-05-15 09:41  vicyang  阅读(6084)  评论(0编辑  收藏  举报