awk中next以及getline用法示例
在awk中,如果调用next,那么next之后的命令就都不执行了。此行文本的处理到此结束,开始读取下一条记录并操作。
实例如下:
- zoer@ubuntu:~$ cat data
- 1000
- naughty 500
- cc 400
- zoer 100
- zoer@ubuntu:~$ awk '{if(NR==1){next} print $1,$2}' data
- naughty 500
- cc 400
- zoer 100
比如说我们有一个data文件,存放了每个人的出差费用。想要打印出来。但是第一行总费用不要打印。那么使用awk的next忽略掉第一行即可。
-------------------------------------------------------------
与next相似,getline也是读取下一行数据。但是与next不同的是,next读取下一行之后,把控制权交给了awk脚本的顶部。但是getline却没有改变脚本的控制,读取下一行之后,继续运行当前的awk脚本。getline执行之后,会覆盖$0的内容。
例子如下:
- zoer@ubuntu:~$ cat data
- name naughty
- 25 shandong
- age 14
- hah,here is test
- zoer@ubuntu:~$ cat d
- $1=="name"{print $0;getline;print $0;}
- $1=="age"{print $0}
- zoer@ubuntu:~$ awk -f d data
- name naughty
- 25 shandong
- age 14
例子中,如果遇到行首是name的,就把下一行读取出来并打印。如果行首是age,就仅仅打印本行。
从运行结果也可以看出来,hah,here is test并没有打印出来。因为它没有匹配name或者age开头。
---------------------------------------------------------------
除了读取本文间的 下一行,getline还能够读取其他文件。
下面例子中,每次读取一行data文件,就读取testdata文件并打印出来。【这个功能可以使用sed的r命令来实现,参考这里】
【存在疑问】
zoer@ubuntu:~$ awk '{print $0;while((getline<"testdata")>0)print $0;}' data
test line 1
1
2
test line 2
test line 3
zoer@ubuntu:~$ cat data
test line 1
test line 2
test line 3
zoer@ubuntu:~$ cat testdata
1
2
帮忙看下这个awk的使用,我想每次从data读取一行打印出来,然后读取testdata的全部打印出来。
然后重复这个过程。请问,为什么testdata的内容只打印了一次??
这里是因为,getline函数,读取testdata文件的时候,处理data文件第一行的时候,testdata文件的文件指针就指向文件末尾了。以后每处理一行data文件,getline函数的返回值都是0。所以不再输出testdata文件的内容。