awk之7 常用函数的解析

1.区域获取

substr(区域f,起始位置n1,获取范围n2)

解析:获取某个区域f内,从起始位置n1开始算起的n2个字符组成的字符串.如果n2不存在,则返回从n1开始到区域结束的内容.

例子:获取某个文件的类型属性

ll filename | awk '{print substr($1,1,1)}' 

$1标示文件的权限区域,第一个数字1标示权限区域的首位,第二个数字1标示获取从首位开始的第一个字符.即类型.

awk的substr函数是从1开始计数


其他类似获取方法:变量的特殊使用.
解析:获取变量n1位置开始算起的n2个字符组成的字符串.${变量名:起始位置n1:获取范围n2}

例子:fd=$(ll filename);echo ${fd:0:1}

变量的获取是从0开始计数


2.区域替换

gsub(/匹配的正则r/,"替换后的字符串s",区域f)

解析:在区域f(若无,则默认是$0)内,将利用正则r匹配到的内容,替换为s

正则表达式,必须用//括起来

如果s是数字,则无需双引号,如果是字符串,必须用引号.

例子:

#echo $fd | awk '{gsub(/^test/,"test1",$NF);print $NF}'

test1.py

#echo $fd

-rwxr--r-- 1 root root 64 5月 6 14:40 test.py


其他类似获取方法:sed的替换

#echo $fd | sed 's/test/test1/'


sed无法将修改限定在某个区域

例如:替换第二个test为abcd

#echo "test1;test2" | sed '/test2/{s/test/abcd/}'

abcd1;test2

但是可以用awk限定仅修改第二个,例如:

#echo "test1;test2" | awk 'BEGIN{FS=";";OFS=";"}{gsub(/test/,"abcd",$2);print $0}'

test1;abcd2


3.获取字符串位置

index("范围字符串s1"或者区域字段f,"需要定位的字符串s2")

解析:在区域f或者字符串s1中,查找字符串s2的起始位置,如果找不到,返回0

例子:

# echo "12345678" | awk '{print index($0,"5")}'

5


4.获取字符串的长度

length("字符串"或区域f)

解析:返回字符串或者区域f的长度,如果不写,则返回$0长度

例子:

# echo "123 123 1234" | awk '{print length($3)}'

4

# echo "123 123 1234" | awk '{print length()}'

12


5.分割字符串形成数组

split("待分割的字符串s",数组a,分隔符r)

解析:用默认FS或者r将字符串s进行分割,然后形成以数字为下标的数组a,下标从1开始.

例子:

root@aaa103439-pc:~# cat test

a1a d2e a3a

b1b d2e b3b

c1c d2e c3c

root@aaa103439-pc:~# awk '{split($1,a,/1/);split($2,b,/2/);split($3,c,/3/);print a[1],b[1],c[1]}' test

a d a

b d b

c d c











posted @ 2014-05-07 16:19  星空刺  阅读(316)  评论(0编辑  收藏  举报