awk

1.awk介绍

默认情况下不编辑源文件报告生成器--通过模式匹配以及自己本身的语言格式，来获取并输出客户所需要的内容；

eg:获取系统上面用户ID大于等于1小于等于500的用户的用户名和用户ID

for i in $(cut -d:-f3/etc/passwd);do

if [ $i -ge 1 -a $i -le 500 ];then

echo grep $i | cut -d:-f1,3

done

-------------------------------------------

#awk -F:’{if($3>=1&&$3<=500){print $3}}’ /etc/passwd

2.awk工作原理

3.awk的用法

awk [option]... ‘program’FILE...

program 必须使用！单引号!
多条program语句使用大括号包含起来可以并列可以嵌套

awk’{print} /etc/passwd’

4.awk的常见option

-F 指定分隔符

awk -F[/:]’{print $1 $3}’a.txt 其中[ ]内表示多个字符中的任意一个

-v 因为awk是一种语言编译器，能够自己定义变量，同时也有内置变量（与环境变量类似）手动指定变量参数

awk-v a=”a/b” ‘{print a}’ a.txt

给a赋值打印a这个变量

1、a是自定义变量 -v FS=”.”

2、在awk中调用变量不用加$符号

扩展：了解cut和awk的区别

5.awk语法格式--program

1、print

默认输出（在屏幕上）

在awk中没有保存命令，我们可以关联别的命令来保存awk的结果；

awk '{a="a/b";print a}' a.txt | tee a.bak

2、printf -- 实现格式化输出

printf "%s是%d班学的最好的学生",变量1，变量2

【仅仅只有顺序关系】

　　格式符

%s 字符串

%d %i 数值

%e %E 科学计算数值

%c ACSii码值

%f 浮点数

%u 无符号整数

%% 逃逸符只显示 % 自己

修饰符

默认为右对齐

- 代表左对齐

%5.4f

5 所占位数

4 所取小数位

awk '/^UUID/{printf "被挂载文件：%-50s 挂载点：%-10s 文件系统格式：%-10s\n",$1,$2,$3}' /etc/fstab

注意：这里提到了地址定界

sed /PAT1/,/PAT2/

3、变量（内置变量、自定义变量）

内置变量 -- 环境变量（bash）(env、set -C +C)

awk语言所默认支持的变量

FS 定义输入分隔符的变量

OFS 定义输出分隔符的变量

NF 定义行分隔以后的参数个数 ($NF 分隔以后最后的一列变量)

*变量引用的时候，不用加$，$0,$1...$n

awk -v FS=":" '/\/bash$/{print $1,$NF}' /etc/passwd

NR 定义文件的行数，定义多个文件的文件的，行号叠加

FNR 文件只计算自己的行号

awk '{print NR}' /etc/fstab /etc/passwd

awk '{print FNR}' /etc/fstab /etc/passwd

FILENAME 存储文件的名字

awk '{print FILENAME}' /etc/passwd //把文件名打印N次，N文件的行数

awk 'BEGIN{print FILENAME}' /etc/passwd //BEGIN{语句} 只在行循环开始时，执行一次;

ARGC 整个命令的段数【注意：不包含 'program' 本身】

ARGV 数组，用来调取命令中，指定的段 ARGV[2] 【注意：数组中也不包含 'program' 】

awk 'BEGIN{print ARGC}' /etc/passwd /etc/fstab /etc/shadow

awk 'BEGIN{print ARGV[3]}' /etc/passwd /etc/fstab /etc/shadow

RS 指定换行符 \n 可以指定新的换行符，不影响本身的换行

ORS 输出的时候指定的换行符，将默认换行符替换为指定字符

awk -v RS=" " '{print}' /etc/passwd

awk -v ORS=" " '{print}' /etc/passwd //可以用来取消换行

自定义变量

-v 变量=值

在后面'program'中去调用自定义变量时，直接使用即可

或者将 “变量=值”语句直接写在'program'亦可；

awk -v a="a/b" '{print a}' a.txt

awk '{a="a/b";print a}' a.txt

4、模式匹配（地址定界）

1.空值，没有定义，默认就将文件中所有的行，放入awk进行循环

2.对固定的1,3 进行操作

sed -n ‘1,3p’ /etc/passwd

awk ‘NR==1&&NR<=3{print}’ /etc/passwd

3./pat1/

sed/pat1/p /etc/paswd

awk’/r..ter/{print}’ /etc/passwd

4./pat1/,/pat2/第一次匹配到pat1到第一次匹配pat2,之间的行

练习：判断/^r..ter/,/user.*\>/之间行的用户，是bash的用户，并显示用户的用户名和uid

shell:

a=`awk’/^r..ter/,/user.*\>/{print $1,$3,$NF}’ /etc/passwd`

for i in `awk’/^r..ter/,/user.*\>/{print $NF}’ /etc/passwd`;do

if[[ $i == “/bin/bash” ]];then

echo’’

done

awk -F:’/^r..ter/,/^usesr.*\>/{if($NF ==/bin/bash);print $1,$3}’ /etc/passwd

5.模式匹配可以直接使用判断语句

awk -F:’$NF ==”/bin/bash”{print $1,$3}’ /etc/passwd

6.BEGIN|END

BEGIN定义在默认循环进行操作前所要执行的语句：

awk -F:’BEGIN{print “shell程序为bash的用户为：\n”}$NF==”/bin/bash”{print $1,$3}’ /etc/passwd

awk -F:’BEGIN{print “shell程序为bash的用户为：\n”}$NF==”/bin/bash”{print $1,$3}END{printf “end\n”}’ /etc/passwd

一般在格式化输出的时候，打印表头和表未；

5、操作符

运算操作符：

+ - * / %(取余、取模) ^ //(取整)

比较运算符：

== != > < >= <=

~ !~

awk -F: '$NF~"/bin/bash"{print $1,$3}' /etc/passwd

awk -F: '$NF!~"/bin/bash"{print $1,$3}' /etc/passwd

逻辑操作符：

赋值操作符：

= += -= /= *= %= ^= //=

条件表达式：

条件语句？条件成立语句：条件不成立的语句

awk '/^title/{FN<=2? print: printf "参数过\n"}' /boot/grub/grub.conf //有点问题

6、常见action

print printf 以及它任何命令的操作都是 action；
1、expressions 常见表达式
2、control statement 控制语句例如： if while等
逻辑关系语句判断来进行结合
3、组合语句 compound statements
/pat1/{{ }{ ; }}
4、input statements 输入语句
5、output statements 输出语句

7、常见语言（if while do for break continue delete switch）

1、if语句

语法格式：if(条件表达式) {执行语句}

if(条件表达式) {执行语句} else {执行语句}

awk '/^title/{if(NF<=2) {print}else {print "参数过少"}}' /boot/grub/grub.conf

awk '/^title/{if(NF>=2) print $4}' /boot/grub/grub.conf

2、while语句

只有对行参数进行遍历的时候才会使用循环；

语法格式：while(条件表达式) {循环体}

练习：过滤grub.conf文件中kernel这一行，然后对每一个参数的字符个数进行统计，并显示出来；

初始值

while 条件判断；do

循环体

初始控制语句

done

awk '/^[[:space:]]*kernel\>/{i=1;while(i<=NF){printf $i"\t";print length($i);i++}}' grub.conf

3、for语句

语法格式：for(初始值;条件判断;初始值控制语句){循环体}

awk '/^[[:space:]]*kernel\>/{for(i=1; i<=NF; i++){printf $i"\t"; print length($i)}}' grub.conf

循环建议使用for语句

在awk中，for也可以使用和 shell 中一样的格式：

回顾：

for i in 列表；do

循环体

done

for(i in 列表){循环体}

echo "xia liang z shi k hen n shuai da fa le " | awk '{for(i in {1..NF}) { ls=() if(length(ls[i])<=3){print $i}}}'

shell

=====================================

ls=(xia liang z shi k hen n shuai da fa le)

for i in `seq 0..${$ls[*]}`;do

if [[ ${#${ls[$i]}} <= 3 ]];then

print ls[$i]

done

=====================================

4、do-while 循环

语法：do {循环体} while (循环条件)

注意和while的却别：while语句只有在满足条件的时候，才会进入循环，而do while会先执行循环体（一次），在进行条件判断；

5、循环跳出语句

break [n] 跳出n次循环；

continue 跳出本次循环；

next 跳出默认的当前循环；

awk '{if(NR%2==1) {next} else {print}}' /etc/passwd

6、switch 类似于case

语法格式：switch(expression){case VALUE1 or /REGXP/: statement; case VALUE2 or /REGEXP2/:statement; … ,default: statement}

switch(表达式){case 模式匹配值:执行语句；case 模式匹配值:执行语句,...,default:执行语句} 文件

shell：

case 变量 in

pat1)

执行语句

;;

执行语句

;;

esac

8、数组

在awk中，数组和shell中的数组特性相同：

注意：awk中数组不用定义，只要使用了，就有值为空的默认数组；这在做数据统计的时候非常常见！！！！！

行遍历 --> 实际上就是整个文件的遍历

列遍历 --> 取对象固定某列的中的，相同数据的统计

注意：数组通过for语句，再给其他变量进行赋值的时候，赋值的是index索引信息；

练习：统计一下某个文件中指定行中单词出现的次数；

awk -v RS=" " {print} a.txt | awk '{ls[$1]++}END{for(i in ls){print i,ls[i]}}'

练习：统计一下一个文件中每个单词（以空格隔开的字符串）出现的次数；

awk '{for(i=1;i<=NF;i++){count[$i]++}}END{for(i in count) {print i,count[i]}}' /etc/fstab

awk '{for(i=1;i<=NF;i++){ls[$i]++}}END{for(j in ls){print j,ls[j]}}' /var/log/httpd/access_log | sort -t" " -k2 -nr

9、函数

1、内置函数

函数的调用：funcation(参数)

length() 统计字符串长度

数学运算上使用的行数 sin() cos() ...

sub(x,x,x) 替换第一个匹配到的值

awk '{print sub(o,O,$1)}' /etc/fstab //将o 替换为 O 文件中的第一列（第一个匹配值）

gsub(x,x,x) 替换该行所匹配到的所有值

awk '{print gsub(o,O,$1)}' /etc/fstab //将 o 替换为 O 文件中的第一列（全部匹配值）

split(x,x,x) 指定分隔符去切割文件

netstat -tan | awk '/^tcp\>/{split($5,ip,":");print ip[1]}'

netstat -tan | awk '/^tcp\>/{split($5,ip,":");count[ip[1]]++}END{for (i in count) {print i,count[i]}}'

2、自定义函数

posted @ 2019-08-22 08:49 Youngstrayschoolgirl 阅读(151) 评论(0) 编辑收藏举报

刷新页面返回顶部

Youngstrayschoolgirl

awk

1.awk介绍

2.awk工作原理

3.awk的用法

4.awk的常见option

5.awk语法格式--program

1、print

2、printf -- 实现格式化输出

3、变量（内置变量、自定义变量）

4、模式匹配（地址定界）

5、操作符

6、常见action

7、常见语言（if while do for break continue delete switch）

8、数组

9、函数

公告