Linux —— awk命令

- 作用: 强大的文本分析工具，对于文本分析来说绝对是一把利器

- 语法: awk '{pattern + action}' {filenames}

　　pattern需要查找的内容

　　action 查找到指定内容后，需要进行的操作

　　filenames 指定文件

- 实例:

　　- head 5 filename | awk '{print $1}'

　　　　读入有'\n'换行符分割的一条记录，然后将记录按指定的域分隔符划分域，填充域，$0则表示所有域,$1表示第一个域,$n表示第n个域。默认域分隔符是"空白键" 或 "[tab]键"

　　- head 5 filename | awk -F ':' '{pritnt $1}'

　　　　F指定域分隔符为':'

　　- head 5 filename | awk -F ':' '{print $1"\t"$7}'

　　　　显示查询记录的第一个和第七个域，并以tab键分割

　　- head 5 filename | awk -F ':''BEGIN {print "name,shell"} {print $1","$7} END {print "blue,/bin/nosh"}'

　　　　awk先执行BEGIN，然后读取文件一条记录，按照action执行，遍历完每一行后，执行END操作

　　- awk -F: '/root' filename

　　　　搜索filename文件内有关root关键字的所有行, 使用-F设置pattern，因为没有action，所以输出每行的内容（pattern支持正则）

　　- awk -F: '/root/{print $7}' filename

　　　　搜索filename内有关root关键字的所有行，并显示对应的第七个域 (设置action为{print $7})

- 内置变量

　　- 变量列表

	ARGV               命令行参数排列
　　　　 ARGC　　　　　　　　 命令行参数个数
	ENVIRON            支持队列中系统环境变量的使用
	FILENAME           awk浏览的文件名
	FNR                浏览文件的记录数
	FS                 设置输入域分隔符，等价于命令行 -F选项
	NF                 浏览记录的域的个数
	NR                 已读的记录数
	OFS                输出域分隔符
	ORS                输出记录分隔符
	RS                 控制记录分隔符

　　- awk -F ':''{print "filename:" FILENAME ",linenumber:" NR ",columns:" NF ",linecontent:"$0}'filename

　　　　统计filename：文件名，每行行号，每行列数，整行信息

- print与printf

　　- print: 可以输出变量，数值，字符串，字符串需要双引号引用，参数用逗号分开

　　- printf: 和C语言类似，可以格式化输出

- awk编程

　　- 变量与赋值

　　　　- awk 'BEGIN {count=0;print "[start] count is ", count} {count=count+1;print $0;} END{print "[end] count is ", count}' filename

　　　　输出filename内的内容，并且统计行数输出，action{}可以有多条语句，分别用逗号隔开

　　- 条件语句

if(expression)
{
    statement;
    ....
}
else if (expression)
{
    statement;
    ....
}
else
{
    statement;
    ...
}

　　- 实例

　　　　ls -l |awk 'BEGIN {size=0;print "[start]size is ", size} {if($5!=4096){size=size+$5;}} END{print "[end]size is ", size/1024/1024,"M"}'

　　　　计算某个文件夹下的文件占用的字节数，过滤大小等于4096的文件

- 循环语句

　　- 与c语言相识

- 数组

　　- awk -F ':' 'BEGIN {count=0;} {name[count] = $1;count++;}; END{for (i = 0; i < NR; i++) print i, name[i]}' filename

　　　统计filename文件内所有的第一个域的值，并输出序号和第一个域

　　　awk的下表可以是数字也可以是字母，key和value在内部hash存储，没有指定顺序

posted @ 2017-02-22 14:22 罗茜阅读(259) 评论(0) 编辑收藏举报

刷新页面返回顶部

罗茜

博主被外星人捉走了，有事请留言，急事请致电。

Linux —— awk命令

公告