高级文件操作

输入输出的介绍

标准输入(stdin) : 从该设配接受用户输入的数据

标准输出(stdout) : 通过该设备向用户输入数据

标准错误: 通过该设备报告执行出错信息


类型 设备文件 文件描述符 默认设备
标准输入 /dev/stdin 0 键盘
标准输出 /dev/stdout 1 显示器
标准错误输出 /dev/stderr 2 显示器

输入输出重定向

通过命令,改变了标准输入输出的方向就是重定向

类型 | 操作符 | 用途
---|------|------|---
重定向标准输出| >| 将命令执行的结果,重定向输入的指定的文件中,而不再是显示屏
重定向标准输出| >> |将命令执行的结果追加到指定的文件中
重定向标准输入|< |将命令中接受到的路径,由默认的键盘,更改为指定的文件

例: 将abc.log的内容当成输入,重定向作为cat的输出

cat < abc.log

标准错误: 通过该设备报告执行出错信息

类型 操作符
重定向标准错误 2>
重定向标准错误 2>>
重定向标准输出 和 标准错误 2>&1 或者 >& 或 &>
重定向标准输出 和 标准错误 到不同的文件 >文件1 2>文件2

其中的2是标识符号

例: 将标准输出和标准错误重定向到不同的文件

ls a.txt aaaa > /dev/null 2>err.txt
如果目标文件是不存在的,会被自动创建出来

例: 将标准输出和标准错误重定向相同的文件

ls a.txt aaaa > /dev/null 2>&1  
如果目标文件是不存在的,会被自动创建出来
1是可以省略的

两个特殊的文件

  • /dev/null 黑洞文件,传递进去的任何文件都会被当成垃圾丢弃
  • /dev/zero 用来创建指定长度的文件,不指定就是空文件

其他命令

echo

在屏幕上显示一段指定的文件或者内容

echo [-n] 字符串

-n: 不会进行换行

[root@ecs-t6-large-2-linux-20190824103606 ~]# echo 123
123
[root@ecs-t6-large-2-linux-20190824103606 ~]# echo -n 123
123[root@ecs-t6-large-2-linux-20190824103606 ~]# 

管道及相关配套命令

操作符

一条竖线 |

作用

连接左右两个命令,将左侧命令的标准输出,作为右侧命令的标准输入

有约束: 左侧命令要支持标准输出, 右侧命令会支持标准输入

格式:

cmd1 | cmd2 | cmd3
出         出入       入 
cmd1的标准输出  被cmd2当成标准输入使用,  cmd2的标准输出被cmd3当成标准输入使用

例: 过滤出 /etc/下包含 pass的行

[root@ecs-t6-large-2-linux-20190824103606 ~]# ls -l /etc | grep pass
-rw-r--r--   1 root root   1092 Sep  8 20:32 passwd
-rw-r--r--.  1 root root   1135 Sep  8 20:29 passwd-

xargs参数

用途: 让一些不支持管道的操作的命令行,可以使用管道

例1:

查看useradd命令所在的位置
[root@ecs-t6-large-2-linux-20190824103606 ~]# which useradd
/usr/sbin/useradd

管道的右边不支持标准输入, 所以它是在对当前目录使用 ls -lh
[root@ecs-t6-large-2-linux-20190824103606 ~]# which useradd | ls -lh
total 0

使用xargs 将左边的标准输入作为参数,添加的右侧的命令中
[root@ecs-t6-large-2-linux-20190824103606 ~]# which useradd |xargs ls -lh
-rwxr-x--- 1 root root 116K Mar 14 18:35 /usr/sbin/useradd

例2 可以实现分批删除:

find 200个文件 | args rm -f 

seq

作用: 打印出一串有序的数字

格式: seq [选项] [范围]

  • -s:指定分隔符
  • -w:指定同等宽度

例:

[root@ecs-t6-large-2-linux-20190824103606 ~]# seq 3
1
2
3

[root@ecs-t6-large-2-linux-20190824103606 ~]# seq 2 3
2
3

[root@ecs-t6-large-2-linux-20190824103606 ~]# seq 5 2 10
5
7
9

[root@ecs-t6-large-2-linux-20190824103606 ~]# seq 1 -1 10
[root@ecs-t6-large-2-linux-20190824103606 ~]# 

死循环
[root@ecs-t6-large-2-linux-20190824103606 ~]# seq 1 0 10
[root@ecs-t6-large-2-linux-20190824103606 ~]# 

[root@ecs-t6-large-2-linux-20190824103606 ~]# seq -s XXX 1 10
1XXX2XXX3XXX4XXX5XXX6XXX7XXX8XXX9XXX10

[root@ecs-t6-large-2-linux-20190824103606 ~]# seq -w 90 100
090
091
092
093
094
095
096
097
098
099
100

tr 转换/删除/压缩

  • 字符转换工具
    不能直接对文件进行操作
    命令: tr set1 set2

作用: 用set2中的字符替换掉set1中相同的字符

echo 123456 | tr 345 abc
将左边标准输出的3 转换为 a , 4->b ,  5->c   只要相同, 一一转换


将 /etc/hosts的内容转大写
tr ‘[a-z]’ ‘[A-Z]’ < /etc/hosts
将A-Z 转换成a-z
  • 使用tr 删除字符

格式 tr -d set
删除和set相同的字符

 [root@ecs-t6-large-2-linux-20190824103606 ~]# echo 123456 | tr -d 123
456
  • 压缩

将连续相同的字符压缩成一个字符

echo 112233444555666 | tr -s 345  
碰到连续的3, 就压缩成1个3  
碰到连续的4, 就压缩成1个4

tr  -s SET1 SET2
先替换为SET2再压缩
echo 112233444555666 | tr -s 345 abc
echo 112233444555666 | tr 345 abc | tr -s abc

排序sort

默认会按照每一行的第一个字符进行排序

  • -n: numeric sort 按整数排序
  • -r: reverse 递减排序
  • -k: key 指定某一列为排序键
  • -t: field-separator 指定字段分隔符

例:

[root@ecs-t6-large-2-linux-20190824103606 tmp]# cat sort_text 
dsd
asd
sad
asa
das
da1
da3
d23
123
316
164
a45
d34
456
234
444
d64
as6
da4
d6a
asd


[root@ecs-t6-large-2-linux-20190824103606 tmp]# cat sort_text | sort -n
a45
as6
asa
asd
asd
d23
d34
d64
d6a
da1
da3
da4
das
dsd
sad
123
164
234
316
444
456

[root@ecs-t6-large-2-linux-20190824103606 tmp]# cat sort_text | sort -n -k2
123
164
234
316
444
456
a45
as6
asa
asd
asd
d23
d34
d64
d6a
da1
da3
da4
das
dsd
sad

例2: 按照表格的方式展示 /etc/passwd 的内容

sort  /etc/passwd  | column -t -s ":"
[root@ecs-t6-large-2-linux-20190824103606 tmp]# sort  /etc/passwd  | column -t -s ":"
adm                x  3    4    adm                                                              /var/adm            /sbin/nologin
bin                x  1    1    bin                                                              /bin                /sbin/nologin
daemon             x  2    2    daemon                                                           /sbin               /sbin/nologin
dbus               x  81   81   System message bus                                               /                   /sbin/nologin
....

uniq命令

删除重复的记录,通常和sort连用

它只会去除连续出现的相同的记录,针对如下记录的结果操作如下
123
123123
123123
123
123



[root@ecs-t6-large-2-linux-20190824103606 tmp]# cat text | uniq
123
123123
123

先排序,再去重的效果如下
[root@ecs-t6-large-2-linux-20190824103606 tmp]# sort -r text | uniq
123123
123


  • -c: count 显示文件中连续出现的次数
[root@ecs-t6-large-2-linux-20190824103606 tmp]# cat text | uniq -c
      1 123
    122 123123
      1 123
  • -u:unique 只显示不重复的行
    cat tt | uniq –u
  • -d:repead 只显示重复的行
    cat tt | uniq -d

wc 命令

wc(字数统计)命令
格式:wc [选项]... 目标文件...

  • -l:lines 统计行数
  • -w:words 统计字数 (前后都是空白的一组字符)
  • -c:bytes 统计字符数(可见和不可见的字符)

例1:

[root@ecs-t6-large-2-linux-20190824103606 ~]# wc /etc/passwd
  23   44 1092 /etc/passwd
23行  44字 1092字节  

例2:

[root@ecs-t6-large-2-linux-20190824103606 ~]# echo 123 | wc -l
1

cut命令

从指定的文本或者文本流中提取指定的列

格式: cut [可选项] 范围 文本/文本流

可选项

  • -c: 从指定位置提取
  • -f: fields 仅仅打印指定的列
  • -d: delimiter 指定分隔符, 默认是 tab

提取范围

  • n: 第n列
  • n-: 从n到列尾
  • -m: 从开头到m
  • n,m:第n和第m项
  • n-m: 从n到m项

例1:

[root@ecs-t6-large-2-linux-20190824103606 tmp]# ll
total 40
drwxr-xr-x 2 root root  4096 Sep  4 19:35 hsperfdata_root
drwxr-xr-x 2 root root  4096 Sep  4 19:35 jetty-0.0.0.0-9998-browser-_browser-any-6157528924019481141.dir
-rw-r--r-- 1 root root    84 Sep  9 21:46 sort_text
drwx------ 3 root root  4096 Sep  4 15:28 systemd-private-c3ac023caef0453f85963d47758cc2cf-ntpd.service-LXVmNS
-rw-r--r-- 1 root root   862 Sep  9 21:54 text
drwx------ 2 root root  4096 Sep  4 20:22 tmp.2RTupK8p7R
prw-r--r-- 1 root root     0 Sep 10 08:53 wrapper-4156-1-in
prw-r--r-- 1 root root     0 Sep 10 08:53 wrapper-4156-1-out
-rw------- 1 root root 13478 Sep  4 20:16 yum_save_tx.2019-09-04.20-16.5iMOEY.yumtx

提取第十列
[root@ecs-t6-large-2-linux-20190824103606 tmp]# ll | cut -c 10

x
x
-
-
-
-
-
-
-

提取20-40 列
[root@ecs-t6-large-2-linux-20190824103606 tmp]# who | cut -c 20-40
   2019-09-10 08:46 (

数据的提取和过滤

grep 数据提取程序

用途: 在文件中查找查找并显示包含指定字符串的行

格式: grep [选项] 模式 目标文件

  • -i: ignore case 查找时忽略大小写
  • -v: invert match 反转查找,输出和模式不相符的行
  • -w: word regexp 按整字查找, 数字,字母,下划线 连在一起就是整字
  • -n: line number 显示符合模式要求的行号
  • -r: 递归查找所有文件
  • -o: 仅仅输出匹配到的字符

模式

a   :包含a的行
^...: 以...开头
...$: 以...结尾

例: 统计文件中某个字的数量

grep -o "abc" abc.txt | wc -l

文件的差异对比

比较两个文件之间的差异

输出结果为两个文件的不同之处

diff [文件1] [文件2]

没有任何输出说明文件不一样

posted @ 2019-09-10 09:05  赐我白日梦  阅读(541)  评论(0编辑  收藏  举报