awk的基本用法

最近遇到导入的csv文件首行为日期,但需要将日期作为列导入到数据库中,直接使用ctl文件好像无法实现,了解到awk这个强大的命令。

导入的CSV文件除了首行为日期,其他的都是格式相同的。需要将首行单独读取出来,获取日期。

首行的格式为:数据日期:2020-06-30

实现方法:var=`(awk 'NR==1{print}' test.csv)`

                 p_date=`echo $var|awk '{print sbstr($1,11,10)}'`

                 echo $p_date

打印出2020-06-30

 

 

整理:

转:使用awk命令获取文本的某一行,某一列

1、打印文件的第一列(域)                 : awk '{print $1}' filename
2、打印文件的前两列(域)                 : awk '{print $1,$2}' filename
3、打印完第一列,然后打印第二列  : awk '{print $1 $2}' filename
4、打印文本文件的总行数                : awk 'END{print NR}' filename
5、打印文本第一行                          :awk 'NR==1{print}' filename
6、打印文本第二行第一列                :sed -n "2, 1p" filename | awk 'print $1'

 

 

基本用法

awk的基本用法就是下面的形式。

# 格式
$ awk 动作 文件名

# 示例
$ awk '{print $0}' demo.txt

上面示例中,demo.txt是awk所要处理的文本文件。前面单引号内部有一个大括号,里面就是每一行的处理动作print $0。其中,print是打印命令,$0代表当前行,因此上面命令的执行结果,就是把每一行原样打印出来。

  var=`(awk 'NR==1{print}' test.csv)`

 在这个语句中,test.csv是awk要处理的文本,单引号中的NR==1{print}是处理动作,表示打印出文本中的第一行,这样var被赋值为  数据日期:2020-06-30

下面,我们先用标准输入(stdin)演示上面这个例子。

$ echo 'this is a test' | awk '{print $0}'
this is a test

上面代码中,print $0就是把标准输入this is a test,重新打印了一遍。

  p_date=`echo $var|awk '{print sbstr($1,11,10)}'`

 将var中内容的第一列数据截取,p_date被赋值为 2020-06-30,此处也可用echo $var|awk -F ':' '{ print $2 }'这种方式,但获取的是2020-05-12,,,,,,还需要再处理

awk会根据空格和制表符,将每一行分成若干字段,依次用$1、$2、$3代表第一个字段、第二个字段、第三个字段等等。

>$ echo 'this is a test' | awk '{print $3}'
a

上面代码中,$3代表this is a test的第三个字段a。

下面,为了便于举例,我们把/etc/passwd文件保存成demo.txt。

>root:x:0:0:root:/root:/usr/bin/zsh
daemon:x:1:1:daemon:/usr/sbin:/usr/sbin/nologin
bin:x:2:2:bin:/bin:/usr/sbin/nologin
sys:x:3:3:sys:/dev:/usr/sbin/nologin
sync:x:4:65534:sync:/bin:/bin/sync

这个文件的字段分隔符是冒号(:),所以要用-F参数指定分隔符为冒号。然后,才能提取到它的第一个字段。

>$ awk -F ':' '{ print $1 }' demo.txt
root
daemon
bin
sys
sync


转自https://www.cnblogs.com/linuxprobe/p/10037122.html

 

posted @ 2020-07-01 13:52  陈斐  阅读(250)  评论(0编辑  收藏  举报