(18)Powershell中的字符串拆分运算符
Powershell中提供了对字符串的拆分操作运算符。-split 运算符将一个字符串拆分成多个字符串。
拆分运算符
拆分运算符用于将一个或多个字符串拆分为多个子字符串。可更改拆分操作的以下元素:
(1)定界符。默认为空白,但是可指定字符、字符串、模式或用于设置定界符的脚本块。
(2)子字符串的最大数目。默认设置为返回所有子字符串。如果指定的数字小于子字符串数,则其余子字符串将合并到最后一个子字符串中。
(3)用于指定定界符匹配条件的选项,如 SimpleMatch 和 Multiline。
拆分运算符的语法如下(3种语法,意味着有三种使用方式):
1 -Split <String>
2 <String> -Split <Delimiter>[,<Max-substrings>[,"<Options>"]]
3 <String> -Split {<ScriptBlock>} [,<Max-substrings>]
需要注意的是,该运算符中没有参数的名称,只包含参数的值。所以参数值必须按语法中指定的顺序出现。-Split 运算有区分大小的格式(默认不区分大小写),-iSplit 运算符不区分大小写。-cSplit 运算符区分大小写,这意味着应用定界符规则时会考虑大小写.
下面对 -Split 运算符的参数举例说明。
String
指定要拆分的一个或多个字符串。如果是多个字符串,则使用给定的相同的分隔符来分割所有的字符串。例如:
PS C:\Windows\System32\WindowsPowerShell\v1.0> -Split "abc def ghi"
abc
def
ghi
Delimiter
分隔符,用于标识子字符串结束位置的字符(即用什么将一个字符串分割成多个子字符串)。默认定界符是空白,包括空格以及如换行符 (n) 和制表符 (
t) 等不可打印字符。拆分字符串时,将从所有子字符串中省略定界符。例如:
PS C:\Windows\System32\WindowsPowerShell\v1.0> "ab:cd:ef" -split ":"
ab
cd
ef
Max-substrings
可选参数,指定返回的子字符串的最大数目。默认设置为通过定界符拆分出的所有子字符串。如果子字符串数目大于最大数目,多出的子字符串将合并到最后一个子字符串中。如果子字符串数目小于最大数目,将返回所有子字符串。使用 0 值或负值时将返回所有子字符串。
如果向拆分运算符提交多个字符串(一组字符串),Max-substrings 限制将单独应用于每个字符串。例如:
PS C:\Windows\System32\WindowsPowerShell\v1.0> $a = "Monday,Tuesday,Wesday,Thurday,Friday,Saturday,Sunday"
PS C:\Windows\System32\WindowsPowerShell\v1.0> $a -split ",", 4
Monday
Tuesday
Wesday
Thurday,Friday,Saturday,Sunday
需要注意的是参数之间是拿逗号隔开的。
Options
该参数仅当语句中使用
Options 参数的语法为:
1 "SimpleMatch [,IgnoreCase]"
2 "[RegexMatch] [,IgnoreCase] [,CultureInvariant][,IgnorePatternWhitespace][,ExplicitCapture][,Singleline | ,Multiline]"
SimpleMatch 选项为:
(1)SimpleMatch:计算定界符时使用简单字符串比较。不可与 RegexMatch 一起使用。
(2)IgnoreCase:强制进行不区分大小写的匹配,即使指定 -cSplit 运算符也如此。
RegexMatch 选项为:
(1)RegexMatch:使用正则表达式匹配来计算定界符。这是默认行为。不可与 SimpleMatch 一起使用。
(2)IgnoreCase:强制进行不区分大小写的匹配,即使指定 -cSplit 运算符也如此。
(3)CultureInvariant:在计算定界符时忽略语言上的区域性差异。仅当与 RegexMatch 一起使用时有效。
(4)IgnorePatternWhitespace:忽略未转义空白以及使用井号 (#) 标记的注释。仅当与RegexMatch 一起使用时有效。
(5)Multiline:使用 Multiline 模式可识别行和字符串的开头和结尾。仅当与 RegexMatch 一起使用时有效。默认设置为 Singleline。
(6)Singleline:使用 Singleline 模式只识别字符串的开头和结尾。仅当与 RegexMatch 一起使用时有效。默认设置为 Singleline。
(7)ExplicitCapture:忽略未命名的匹配组,以便仅在结果列表中返回显式捕获组。仅当与RegexMatch 一起使用时有效。
ScriptBlock
用于指定定界符应用规则的表达式。该表达式的计算结果必须是 $true 或 $false。脚本块需放在大括号中。例如:
PS C:\Windows\System32\WindowsPowerShell\v1.0> $a = "Monday,Tuesday,Wesday,Thurday,Friday,Saturday,Sunday"
PS C:\Windows\System32\WindowsPowerShell\v1.0> $a -split {$_ -eq "n" -or $_ -eq "r"}
Mo
day,Tuesday,Wesday,Thu
day,F
iday,Satu
day,Su
day
从上面的语句可以看出,在指定的字符串中查找指定的分隔符(本例中的是"n"或者"r"),查找到就执行分隔操作。
2. 一元和二元拆分运算符
-split
PS C:\Windows\System32\WindowsPowerShell\v1.0> -split "a b","c d"
a
b
c d
[string] -split
PS C:\Windows\System32\WindowsPowerShell\v1.0> "a b","c d" -split " "
a
b
c
d
PS C:\Windows\System32\WindowsPowerShell\v1.0> -split ("a b","c d")
a
b
c
d
PS C:\Windows\System32\WindowsPowerShell\v1.0> $a = "a b","c d"
PS C:\Windows\System32\WindowsPowerShell\v1.0> -split $a
a
b
c
d
总结
Powershell中的拆分运算符可以对指定的字符串进行分隔,意味着可以截取字符串中的指定部分,这往往用于对时间格式的截取,或是截取文件名并进行模糊查找。