linux系统中的单引号和双引号

一、为什么用quoting

前面说到,命令行在内容上主要由literal(一般文字)和meta(元字符)组成,而meta又由IFS、CR和其他字符组成(如=,$, > 等),通常这些原元字符都有其特殊功能,假如我们需要在命令行中将这些保留字符的功能关闭的话,就需要quoting处理了。

 

二、使用quoting的方法

bash 中,常用的 quoting 有如下三种方法:

  • hard quote:' ' (单引号)凡在hard quote中的所有meta均被关闭。

  • soft quote: " " (双引号)在soft quote中大部份meta都会被关闭,但某些则保留(如$ )。

  • escape :\ (反斜线)只有紧接在 escape (跳脱字符)之后的单一meta才被关闭。

 

 

三、 <Enter>键在不同情况下的解读

1 $ A='B 
2 > C 
3 > ' 
4 $ echo "$A" 
5 B 
6 C

在上例中,由于被置于 hard quote 当中,因此不再作为 CR 字符来处理。

这里的<enter>单纯只是一个断行符号(new-line)而已,由于command line 并没得到 CR 字符,因此进入第二个shell prompt (PS2,以>符号表示),command line 并不会结束,直到第三行,我们输入的并不在hard quote 里面,因此并没被关闭,此时,command line 碰到CR字符,于是结束、交给shell来处理。上例的要是被置于soft quote 中的话, CR也会同样被关闭:

1 $ A="B 
2 > C 
3 > " 
4 $ echo $A 
5 B C

然而,由于 echo $A 时的变量没至于 soft quote 中,因此当变量替换完成后并作命令行重组时,会被解释为 IFS ,而不是解释为 New Line 字符。

$ A=B\ 
> C\ 
> 
$ echo $A 
BC

同样的,用 escape 亦可关闭 CR 字符:

上例中,第一个跟第二个均被escape字符关闭了,因此也不作为CR来处理,但第三个由于没被跳脱,因此作为CR结束 command line 。但由于<enter>键本身在shell meta中的特殊性,在\跳脱后面,仅仅取消C功能,而不会保留其IFS能。

光是一个<enter>键所产生的字符就有可能是如下这些可能:

CR
IFS
NL(New Line)
FF(Form Feed)
NULL

 

四、 shell meta 与command meta的区分

前面我们提到的那些 meta ,都是在 command line 中有特殊用途的,比方说{ }是将其内一系列command line置于不具名的函式中执行(可简单视为command block),但是,awk 却需要用 { } 来区分出awk 的命令区段(BEGIN, MAIN, END)。若你在command line 中如此输入:

1 $ awk {print $0} 1.txt

由于{ }在shell中并没关闭,那shell就将{print $0}视为command block,但同时又没有";"符号作命令区隔,因此就出现 awk 的语法错误结果。要解决之,可用 hard quote :

1 $ awk '{print $0}' 1.txt

上面的 hard quote 应好理解,就是将原本的 {、、$(注三)、} 这几个 shell meta 关闭,避免掉在shell 中遭到处理,而完整的成为 awk 参数中的 command meta 。
( 注三:而其中的 $0 是 awk 内建的 field number ,而非awk的变量,awk 自身的变量无需使用$)
要是理解了 hard quote 的功能,再来理解 soft quote 与 escape 就不难:

1 awk "{print \$0}" 1.txt 
2 awk \{print\ \$0\} 1.txt

然而,若你要改变 awk 的 $0 的 0 值是从另一个 shell 变量读进呢?

1 A=0 
2 awk "{print \$$A}" 1.txt 
3 awk \{print\ \$$A\} 1.txt 
4 awk '{print $'$A'}' 1.txt 
5 awk '{print $'"$A"'}' 1.txt  # 注:"$A" 包在 soft quote 中

 

五、参考

1. 《shell十三问》

(完)

posted @ 2016-01-11 15:32  大师兄啊哈  阅读(1756)  评论(0编辑  收藏  举报