awk常用的命令

awk常用的命令

     概述

     awk是一种编程语言,用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入(stdin)、一个或多个文件,或其它命令的输出。

     它支持用户自定义函数和动态正则表达式等先进功能,它在命令行中使用,但更多是作为脚本来使用。

     一、基本用法

     awk 动作 文件名

     比如:awk '{print $0}'  stat.log

     上面示例中, stat.log是awk所要处理的文本文件。前面单引号内部有一个大括号,里面就是每一行的处理动作print $0。其中,print是打印命令,$0代表当前行,因此上面命令的执行结果,就是把每一行原样打印出来。

     1)原样打印

     我们先用标准输入(stdin)演示上面这个例子:

     echo 'this is a test' | awk '{print $0}'

     打印结果:

      

    上面代码中,print $0就是把标准输入this is a test,重新打印了一遍。

     2)分成若干字段

     awk会根据空格和制表符,将每一行分成若干字段,依次用$1、$2、$3代表第一个字段、第二个字段、第三个字段等等。

     echo 'this is a test' | awk '{print $3}'

     

     在stat.log中文件写入:

1 t:x:0:0:root:/root:/usr/bin/zsh
2 
3 daemon:x:1:1:daemon:/usr/sbin:/usr/sbin/nologin
4 
5 bin:x:2:2:bin:/bin:/usr/sbin/nologin
6 
7 sys:x:3:3:sys:/dev:/usr/sbin/nologin
8 
9 sync:x:4:65534:sync:/bin:/bin/sync

    这个文件的字段分隔符是冒号(:),所以要用-F参数指定分隔符为冒号。然后,才能提取到它的第一个字段。

    命令如下:

    awk -F ':' '{ print $1 }' stat.log

    输出结果:

     

     二、变量

     1、NF

      除了$ + 数字表示某个字段,awk还提供其他一些变量。

      变量NF表示当前行有多少个字段,因此$NF就代表最后一个字段。

      比如:echo 'this is a test' | awk '{print $NF}

      $(NF-1)代表倒数第二个字段。 

      比如:awk -F ':' '{print $1, $(NF-1)}' demo.txt

      

     2、NR

     变量NR表示当前处理的是第几行。

     awk -F ':' '{print NR ") " $1}' stat.log

     

  

    参考链接:

    http://www.ruanyifeng.com/blog/2018/11/awk.html

    https://segmentfault.com/a/1190000021462472

posted @ 2021-11-17 13:25  欢乐豆123  阅读(565)  评论(0编辑  收藏  举报