shell三剑客介绍及实例

Linux三剑客指的是grep、sed、awk,配合正则表达式使用就非常强大,笔者个人感觉会使用普通的场景就足够工作中适用了,其中grep擅长查找功能,sed擅长取行和替换。awk擅长取列,笔者分别针对这些功能列举语法以及实际案例。新手入门,如有问题,欢迎指正 ~ 

 

最开始,先介绍一下管道的概念,| 这个竖线就是管道的意思,后文中会持续用到该符号,作用就是将前一个命令的输入输送给 | 后面的命令,可以进行多重管道,例如:

一、grep

  grep作用是筛选,查询

  1. 语法规则

  Usage: grep [选项]... 匹配项 [文件]...

  支持的正则 描述

   

  -E,--extended-regexp 模式是扩展正则表达式(ERE)

  -e,--regexp=PATTERN 使用模式匹配,可指定多个模式匹

  -f,--file=FILE 从文件每一行获取匹配模式

  -i,--ignore-case 忽略大小写

  -w,--word-regexp 模式匹配整个单词

  -x,--line-regexp 模式匹配整行

 

  输出控制 描述

  -m,--max-count=NUM 输出匹配的结果 num 数

  -n,--line-number 打印行号

  -H,--with-filename 打印每个匹配的文件名

  -h,--no-filename 不输出文件名

  -o,--only-matching 只打印匹配的内容

  -q,--quiet 不输出正常信息

  -s, --no-messages 不输出错误信息

  -r,--recursive 递归目录

  -c,--count 只打印每个文件匹配的行数

  --include=FILE_PATTERN 只检索匹配的文件

  --exclude=FILE_PATTERN 跳过匹配的文件

  --exclude-from=FILE 跳过匹配的文件,来自文件模式

  --exclude-dir=PATTERN 跳过匹配的目录

  -v,--invert-match 打印不匹配的行

  

  内容行控制 描述
  -B,--before-context=NUM 打印匹配的前几行

  -A,--after-context=NUM 打印匹配的后几行

  -C,--context=NUM 打印匹配的前后几行

  --color[=WHEN], 匹配的字体颜色

 

    2. 案例

  # 很常用的使用 grep 筛选 目前服务器 使用的java tomcat nginx进程

  

 

 

  # 查询日志关键词 -e 达标多个条件

 

  

 

  #  输出查询内容后5行的日志 

 

  

 

 

   #   通过正则来筛选结果 

   #   查询以 ACTIVITY 开头的日志

  

   #   查询所有出现的时间  

  

   #  查询出所有符合条件的IP地址

  

 

二、sed

  sed作用是过滤和替换文本。

  1. 语法规则 

  sed [选项] '地址 命令' file 

  选项 描述
  -n 不打印模式空间
  -e 执行脚本、表达式来处理
  -f 执行动作从文件读取执行
  -i 修改原文件
  -r 使用扩展正则表达式

  地址 描述
  first~step 步长,每 step 行,从第 first 开始
  $ 匹配最后一行
  /regexp/ 正则表达式匹配行
  number 只匹配指定行
  addr1,addr2 开始匹配 addr1 行开始,直接 addr2 行结束
  addr1,+N 从 addr1 行开始,向后的 N 行
  addr1,~N 从 addr1 行开始,到 N 行结束

  命令 描述
  s/要替换的内容/替换成的内容/ 替换字符串
  p 打印当前模式空间
  P 打印模式空间的第一行
  d 删除模式空间,开始下一个循环
  D 删除模式空间的第一行,开始下一个循环
  = 打印当前行号

  2. 案例

   #  替换输入内容(其中不以g结尾是替换每行中的第一个"11",否则就是替换所有的"11")

  

 

  # 替换文件内容并覆盖(-i 参数 代表替换文件内容)

  

三、awk

  awk是一个处理文本的编程语言工具,能用简短的程序处理标准输入或文件、数据排序、计算以及生成报表等等。

  1. 语法规则 

  基本的命令语法:awk option 'pattern {action}' file

  其中 pattern 表示 AWK 在数据中查找的内容,而 action 是在找到匹配内容时所执行的一系列命令。花括号用于根据特定的模式对一系列指令进行分组。

  选项 描述
  -f program-file 从文件中读取 awk 程序源文件

  -F fs 指定 fs 为输入字段分隔符

  -v var=value 变量赋值

  pattern (匹配模式)

  /regular expression/ 为每个输入记录匹配正则表达式

  pattern && pattern 逻辑 and,满足两个模式

  pattern || pattern 逻辑 or,满足其中一个模式

  ! pattern 逻辑 not,不满足模式

  

  BEGIN{ } 给程序赋予初始状态,先执行的工作

  END{ } 程序结束之后执行的一些扫尾工作

  2. 案例

   #  输出指定列 

   

 

   # 指定分隔符 

  

 

 

   # BEGIN END的使用(可以用作格式化输出,也可以在其中做一些初始化,以及收尾的工作)

   #  格式化输入

  

 

  #  初始化分隔符和换行符,最后列数与记录数

  

 

   其中: FS 输入字段分隔符,默认是空格或制表符

       RS 输入记录分隔符,默认是换行符\n

       NF 统计当前记录中字段个数

       NR 统计记录编号,每处理一行记录,编号就会+1

  #  使用正则的场景(筛选出符合条件的列,按照默认空格切分后,输出第三列)

  

 

写在文末:列举了这么多,实际都是想象中的用法,实际工作中我目前只用到了 grep的简单场景,如有啥问题,请多包涵【狗头】

  

 

posted @ 2020-11-26 11:30  时念  阅读(1766)  评论(0编辑  收藏  举报
Live2D