C#语法文本字面量

C#语法文本字面量

在日常生活中,文本用来表示除了数字以外的内容。例如有一个叫“比尔”的人,他的职位为“科长”。那么,“比尔”和“科长”都可以称为文本。在计算机里,现实世界中的文本通常被称为字符和字符串。例如,“比尔”中的每个汉字都是一个字符。而整体构成一个字符串。“科长”也是如此。

字符和字符串的写作规范

上面,我们看到的是常见的文本字面量。但是,很多时候数字内容表达的并不一定是数值。例如,比尔的电话号码是13466668888。对于“13466668888”来说,我们不会理解为一百三十四亿六千六百六十六万八千八百八十八,而是当成一个电话号来理解。由于计算机能力有限,为了避免这类信息对计算机造成困扰,程序对字符和字符串的表示有以下规定:

 

  • 字符是由单引号(')括起来的单个的字母、数字、字或者符号。
  • 字符串可以表示一个字符序列。
  • 字符串使用一对双引号(")与多个字符组合。
  • 字符串的双引号中可以有任意多个字符。

 

根据这个规范,如果要在程序中表示字母a,需要写为'a'。字符中只能包含一个字符,因此字符'a'长度为1。如果要在程序中表示比尔的电话号码,必须写为"13466668888"。该字符串的长度为11,因为包含的字符个数为11,而双引号是字符串格式符号,不能算作字符串长度数。

特殊的字符和字符串——转义字符

有时候,需要在字符串中使用特殊字符,例如字符串abc"s。在代码中字符串"abc"s"会产生错误,编译器无法辨认字符串的具体内容。为了解决这个问题,需要使用转义字符。转义字符通过反斜杠“\”与普通字符的组合,来表示一些特殊的字符。转义字符中至少包含两个字符,第一个字符是转义符号“\”,第二个字符是需要表示的字符。常用的转义字符有两种:表示格式的转义字符和表示控制代码的转义字符。

1.表示格式

为了构成字符和字符串,使用了双引号(")和单引号(')。而为了构成转义字符,又使用了反斜杠(\)。如果字符串中需要包含这三个字符,需要使用转义字符如表1.1所示。

表1.1  表示格式的转义字符列表

转义序列

产生的字符

\'

单引号

\"

双引号

\\

反斜杠

【示例1-4】有下列文本内容,需要在程序中使用字符串表示。

I love C#.

I’m studying C#.

在这个文本内容中,第一行内容表达为字符串为"I love C#.",该字符串长度为10(空格与.都算作一个字符)。而第二行内容中有一个单引号,所以需要使用转义字符表达为"I\'m studying C#.",该字符串长度为16。

2.表示控制代码

在文本数据中,会出现一些特殊的符号,如换行符、退格等。这些符号无法看到,但是用来控制文本的格式。这类字符由于无法书写,所以必须使用转义字符表示如表1.2所示。

表1.2  表示控制代码的转义字符序列

转义序列

产生的字符

\a

警报

\b

退格

\f

换页符

\n

换行符

\r

回车

\t

水平制表符

\v

垂直制表符

示例1-4中由于两个文本内容不在同一行,所以之间必须有“\n”来表示换行。因此,这两个文本的正确表示形式为"I love C#.\n I\'m studying C#."。这个字符串的长度为27。

更全面的表达方式——ASCII表

转义字符可以解决大部分的字符表达。但是还是有很多字符无法直接书写,也没有对应的转义字符。这个时候,只能使用ASCII进行表达。ASCII是基于拉丁字母(26个英语字母)的一套电脑编码系统,是现在最通用的单字节编码系统。使用ASCII表示字符的格式如表1.3所示。

表1.3  使用ASCII表示的字符

转义序列

产生的字符

\0

空字符

\ddd

1~3位八进制数所代表的任意字符

\xhh

1~2位十六进制数所代表的任意字符

在表1.3中,使用八进制表示字符时可以表示1~3位八进制数代表的任意字符,即该类转义字符总长度为2~4。使用十六进制表示字符时可以表示1~2位十六进制数代表的任意字符,即该类转义字符总长度为3~4,因为表示十六进制数时“\x”以开头。

【示例1-5】以下代码中使用了转义字符:

'\x2f'

'\013'

其中,\x表示后面的字符是十六进制数,\0表示后面的字符是八进制数。

为了更加全面地表示,这里给出了ASCII表的字符的0~127。具体如表1.4所示。

表1.4  ASCII表

十进制

十六进制

字符

十进制

十六进制

字符

十进制

十六进制

字符

十进制

十六进制

字符

0

00

 

32

20

[空格]

64

40

@

96

60

`

1

01

 

33

21

!

65

41

A

97

61

a

2

02

 

34

22

"

66

42

B

98

62

b

3

03

 

35

23

#

67

43

C

99

63

c

4

04

 

36

24

$

68

44

D

100

64

d

5

05

 

37

25

%

69

45

E

101

65

e

6

06

 

38

26

&

70

46

F

102

66

f

7

07

 

39

27

'

71

47

G

103

67

g

8

08

\b

40

28

(

72

48

H

104

68

h

9

09

\t

41

29

)

73

49

I

105

69

i

10

0A

\r

42

2A

*

74

4A

J

106

6A

j

11

0B

 

43

2B

+

75

4B

K

107

6B

k

12

0C

 

44

2C

,

76

4C

L

108

6C

l

13

0D

\n

45

2D

-

77

4D

M

109

6D

m

14

0E

 

46

2E

.

78

4E

N

110

6E

n

15

0F



47

2F

/

79

4F

O

111

6F

o

16

10



48

30

0

80

50

P

112

70

p

17

11



49

31

1

81

51

Q

113

71

q

18

12



50

32

2

82

52

R

114

72

r

19

13

 

51

33

3

83

53

S

115

73

s

20

14

 

52

34

4

84

54

T

116

74

t

21

15

 

53

35

5

85

55

U

117

75

u

22

16



54

36

6

86

56

V

118

76

v

23

17



55

37

7

87

57

W

119

77

w

24

18



56

38

8

88

58

X

120

78

x

25

19



57

39

9

89

59

Y

121

79

y

26

1A



58

3A

:

90

5A

Z

122

7A

z

27

1B

 

59

3B

;

91

5B

[

123

7B

{

28

1C



60

3C

92

5C

\

124

7C

|

29

1D



61

3D

=

93

5D

]

125

7D

}

30

1E

-

62

3E

94

5E

^

126

7E

~

31

1F

 

63

3F

?

95

5F

_

127

7F



表1.4中很多字符都是无法显示的,所以以空白显示。在编码中,可以通过反斜杠“\”与ASCII字符的十六进制数结合的方式使用字符。例如,“\n”与“\0D”起到的作用是一致的。但是大多数字符可以直接输出,不需要使用此种方式。

避免转义字符——@

在编程中,有时候字符的组合恰巧与转义字符相同,此时就需要使该组合中的转义字符失效。C#中有一个特殊的字符 “@”,该字符的作用是声明原义字符串,忽略转义字符的作用。

【示例1-6】假如想要表示一个地址“c:\temp”。当我们在代码中输出“c:\temp”时,显示结果如下:

c:        emp

为什么会显示这样的一个结果呢?因为在“c:\temp”中,字符串中的“\t”被计算机识别成了转义字符,因此起的作用是水平制表符。在这种情况下,可以使用转义字符“\\”将反斜杠输出,让该字符串表示一个地址,表示方式为:

"c:\\temp"

这样的表示方式可以暂时解决眼前的简单的地址。但是,如果想要表示的地址很长很复杂,里面包含多个反斜杠时,这种书写方式就会非常繁琐。例如,需要表示的地址为“c:\temp\1\t\3\a\5”时,使用这种方式表示出来为:

"c:\\temp\\1\\t\\3\\a\\5"

上述这种表示方式非常繁琐,容易书写错误。因此,可以使用特殊符号@来屏蔽转义字符的作用。当我们想表示地址“c:\temp\1\t\3\a\5”时,只需要在地址前面加上特殊字符@即可,表示方式如下:

@"c:\temp\1\t\3\a\5"

字符串长度

上面我们学习了字符、字符串、转义字符等,接着我们来了解它们各自的字符长度。各种字符和字符串的类型、示例、长度及输出结果具体如表1.5所示:

表1.5  字符串长度

类型

字符/字符串示例

长度

实际含义

普通字符

'a'

1

a

普通字符串

"abc"

3

abc

带单引号的字符串

"ab\'c"

4

ab'c

带控制代码的字符串

"ab\nc"

4

ab

c

带ASCII表示的字符串

"ab\x22"

3

ab"

使用@的字符串

@"ab\x22"

6

ab\x22

posted @ 2017-10-10 10:10  大学霸  阅读(880)  评论(0编辑  收藏  举报