拾遗:Perl 基础语法

Perl 常用的命令行参数

  • -i:将处理结果直接写入文件,可以通过 -i.bak 或 -i"/tmp/orig_*" 等形式,在修改之前进行备份
  • -e:启用 perl 的命令行模式,perl 默认是执行脚本文件,必备选项
  • -n:按行处理,以类似 grep 的方式逐行读取文件进行处理
  • -a:将读入的内容,以特定分割符(默认是空格)分解成多个字段,存入 perl 预定义的 @F 数组中
  • -F:与 -a 选项配合使用,用于自定义分割符

Perl 的数据类型:

  • 标量:整型、浮点型、字符串等,以 $VarName = “Aa” 形式定义
  • 数组:以 @VarName = (“Aa”, 56, “Cc”) 形式定义
  • 字典:以 %VarName = {"Aa"=>10, "Ba"=>20, "Cc"=>30} 形式定义

以上三种类型在调用时,也是使用各自的标识符,如:$VarName 调用了一个标量,@VarName 调用了一个数组,%VarName 则调用了一个字典。

如:

  • $VarName[2..-1] 是指取数组的第 3 至最后一个元素
  • $VarName = (@Var1, @Var2) 表示将两个现有数组的内容合并为一个新数组
  • $VarName{"Aa"} 指取字典中 Key 为 "Aa" 的值

相同数据类型之间,可以直接赋值,将数据内容进行复制;若将一个数组以 ‘=’ 赋值给了一个标量,则标量接收到的是数组的元素个数。

Perl 特有的转义字符

  • \u:表示将其后紧跟的第一个字符转换为大写
  • \U:表示将其后所有字符转换为大写,直到遇到 \E 或到达字符串开尾
  • \l:同 \u,转换为小写
  • \L:同 \U,转换为小写
  • \Q:将其后的所有非字母字符进行转义,即在前面添加转义字符:'\',如:\QI lo_ve cat 将被转换为 I\ lo\_ve \cat
  • \E:\U \L \Q 三者的作用域结束标志

Perl 正则变量

  • $N:包含上次模式匹配的第 N 个字符串,以圆括号为标识,如:$1、$2 等
  • $& 或 $MATCH:前一次成功匹配到的内容
  • $` 或 $PREMATCH:前一次匹配到的内容之前的内容
  • $' 或 $POSTMATCH:同上,表示之后的内容

Perl 的内置变量

  • %ENV :存储主机环境变量的字典
  • @ARGV :命令行参数列表
  • @F :用于存储 -a 选项分离出来的数组元素,即命令行的数组输入
  • STDIN :标准输入文件描述符(句柄)
  • STDOUT :标准输出
  • STDERR :标准错误
  • __FILE__ :perl 脚本所在文件名称
  • __LINE__ :perl 语句所在的行号
  • __PACKAGE__ :perl 语句所在的包名称
  • $! :此变量存储了错误信息
  • $_ 或 $ARG :默认输入和模式匹配内容
  • @_ :类似 $_
  • %_ :类似 $_
  • $. 或 $NR:匹配到的内容所在行号
  • $/ 或 $RS:输入记录的分割符,默认为行尾,即换行符
  • $\ 或 $ORS:输出记录的分割符
  • $, 或 $OFS:输出字段的分割符
  • $? :上一条外部命令的执行结果状态,0 表示成功
  • $PID、$UID、$EUID、$GID、$EGID :进程 ID 等
  • $0 :perl 脚本名称

数组操作函数

  • push:将指定数据项追加到数组末尾,如:push(@VarName, "Hello", "World") 
  • pop:将数组最后一个元素弹出(即:删除),并返回这个被弹出的元素的值
  • shift:弹出数组的第一个元素,并返回它的值
  • unshift:将新元素添加到数组的开头,并返回新数组的元素个数
  • splice:数组部分内容替换,如:splice(@VarName, 5, 3, 4, 5, 6),指将数组的第六个元素开始的连续三个元素分别替换为 4 5 6
  • split:将字符串按指定的分割符切分成数组,如:split('-', "my-me-you"),将生成数组 ("my", "me", "you")
  • join:将数组整合成字符串,如:join('_', ("my", "me", "you")) 就生成了 "my_me_you"
  • sort:数组排序,返回排序后的值,如:@VarName = sort(@VarName) 这样操作可直接更改原始值

字典操作函数:

  • keys:返回字典所有 key 组成的数组,如:@Keys = keys %Map
  • values:返回字典所有 value 组成的数组,如:@Values = values %Map
  • exists:检测某个 key-value 是否存在,返回布尔值,如:exists(%Map{"NewYork"})
  • delete:从字典中删除元素,如:delete %Map{"London"}

Perl 模式

  • 严格模式:如果在 perl 脚本开头指明了 "use strict;",则所有变量之前都必须添加 my 修饰符,表示私有变量
  • 警告模式:如果在 perl 脚本开头指明了 "use warnings;",则运行时会有更多的提示

Perl 条件判断:

  • if 结构:if...elsif...else...
  • unless 结构:unless...elsif...else...
  • 三目运算:?::

Perl 循环:

  • while
  • until
  • for
  • foreach
  • do...while

Perl 循环控制语句:

  • next:跳过后续语句,进入下一次循环
  • last:结束循环,类似于 C 中的 break
  • redo:重新以最初状态开始循环
  • goto:类似 C 的跳转
  • continue:与 C 中的不同,用于指定每次循环都必须执行的语句,语法如:while {...} continue {...}

Perl 特有的运算符:

  • %:取余
  • **:幂运算,如:4**10 是指求 4 的 10 次方的值
  • <=>:比较两个数字,相等返回 0,前者大返回正数,前者小返回负数
  • lt、gt、le、...等:与 shell 中的 -lt、-gt 等类似,但不同的是 perl 用于比较字符串,而不是数字
  • cmp:比较两个字符串,相等返回 0,前者大返回正数,前者小返回负数
  • &、|、^、~、<<、>>:perl 支持位运算
  • and、or、not:逻辑运算符
  • q{}:等同于单引号
  • qq{}:等同于双引号
  • qx{}:等同于反号,用于执行外部 shell 命令
  • . :'点'表示连接两个或多个字符串
  • x N:表示将前面的字符或字符串重复 N 次
  • -> :类与方法的关系符号

Perl 时间函数

  • time():1970年1月1日至今的秒数
  • localtime():本地时间,格式化输出,类似于 date 命令
  • gmtime():格林豪治时间

Perl 函数:

  • sub FuncName {...}:定义方式,没有显式的参数列表
  • FuncName(...):调用时可以提供任意多个参数
  • perl 会将接收到的所有参数存储在内置的 @_ 数组中
  • 参数既有标量又有数组时,要把标量放在前面
  • 可以传递字典,在函数内部需要以 %VarName 的新字典数据类型接收,以还原字典结构
  • my 修饰的变量表示完全私有变量
  • local 修饰的变量表示在当前环境及内部调用的函数中有效

Perl 指针(引用)

  • \ :反斜线表示引用对象地址,如:$Var = \$VarName 表示 Var 是一个引用(指针),同理,@Var = \@VarName 与 %Var = \%VarName 意义类似;解引用时使用 $$VarName、%%VarName 等这种形式
  • [] :方括号可用于创建匿名数组,如:$VarAddr = [1, 2, 3],表示 VarAddr 这个标量中存储了一个匿名数组的地址
  • {} :同上,可以定义匿名字典,以标量存储其地址,取其值时,用对应的 $、@、% 标识符解引用,即可获得值

Perl 错误处理函数

  • die :显示错误信息,并退出进程,如:system("poweroff") or die "Can't poweroff $!"
  • warn:显示错误信息,但不退出进程
posted @ 2014-02-13 17:54  范辉  阅读(302)  评论(0编辑  收藏  举报