awk的基本用法

最近遇到导入的csv文件首行为日期，但需要将日期作为列导入到数据库中，直接使用ctl文件好像无法实现，了解到awk这个强大的命令。

导入的CSV文件除了首行为日期，其他的都是格式相同的。需要将首行单独读取出来，获取日期。

首行的格式为：数据日期：2020-06-30

实现方法：var=`(awk 'NR==1{print}' test.csv)`

p_date=`echo $var|awk '{print sbstr($1,11,10)}'`

echo $p_date

打印出2020-06-30

整理：

转：使用awk命令获取文本的某一行，某一列

1、打印文件的第一列(域)             ： awk '{print $1}' filename
2、打印文件的前两列(域)               ： awk '{print $1,$2}' filename
3、打印完第一列，然后打印第二列： awk '{print $1 $2}' filename
4、打印文本文件的总行数              ： awk 'END{print NR}' filename
5、打印文本第一行                          ：awk 'NR==1{print}' filename
6、打印文本第二行第一列                ：sed -n "2, 1p" filename | awk 'print $1'

基本用法

awk的基本用法就是下面的形式。

# 格式
$ awk 动作 文件名

# 示例
$ awk '{print $0}' demo.txt

上面示例中，demo.txt是awk所要处理的文本文件。前面单引号内部有一个大括号，里面就是每一行的处理动作print $0。其中，print是打印命令，$0代表当前行，因此上面命令的执行结果，就是把每一行原样打印出来。

var=`(awk 'NR==1{print}' test.csv)`

在这个语句中，test.csv是awk要处理的文本，单引号中的NR==1{print}是处理动作，表示打印出文本中的第一行，这样var被赋值为数据日期：2020-06-30

下面，我们先用标准输入（stdin）演示上面这个例子。

$ echo 'this is a test' | awk '{print $0}'
this is a test

上面代码中，print $0就是把标准输入this is a test，重新打印了一遍。

p_date=`echo $var|awk '{print sbstr($1,11,10)}'`

将var中内容的第一列数据截取，p_date被赋值为 2020-06-30，此处也可用echo $var|awk -F ':' '{ print $2 }'这种方式，但获取的是2020-05-12，，，，，，还需要再处理

awk会根据空格和制表符，将每一行分成若干字段，依次用$1、$2、$3代表第一个字段、第二个字段、第三个字段等等。

>$ echo 'this is a test' | awk '{print $3}'
a

上面代码中，$3代表this is a test的第三个字段a。

下面，为了便于举例，我们把/etc/passwd文件保存成demo.txt。

>root:x:0:0:root:/root:/usr/bin/zsh
daemon:x:1:1:daemon:/usr/sbin:/usr/sbin/nologin
bin:x:2:2:bin:/bin:/usr/sbin/nologin
sys:x:3:3:sys:/dev:/usr/sbin/nologin
sync:x:4:65534:sync:/bin:/bin/sync

这个文件的字段分隔符是冒号（:），所以要用-F参数指定分隔符为冒号。然后，才能提取到它的第一个字段。

>$ awk -F ':' '{ print $1 }' demo.txt
root
daemon
bin
sys
sync

转自https://www.cnblogs.com/linuxprobe/p/10037122.html

posted @ 2020-07-01 13:52 陈斐阅读(264) 评论(0) 编辑收藏举报

刷新页面返回顶部

陈斐

awk的基本用法

公告