Linux-07管道、环境变量与常用命令
管道
概念
- 管道类似于文件重定向,可以将前一个命令的
stdout
重定向到下一个命令的stdin
。
要点
-
管道命令仅处理
stdout
,会忽略stderr
。 -
管道右边的命令必须能接受
stdin
。 -
多个管道命令可以串联。
与文件重定向的区别
-
文件重定向左边为命令,右边为文件。
-
管道左右两边均为命令,左边有stdout,右边有stdin。
举例
-
统计当前目录下所有python文件的总行数,其中find、xargs、wc等命令可以参考常用命令这一节内容。
find . -name '*.py' | xargs cat | wc -l
-
find . -name ".py | cat
:获取为.py结尾的文件名 -
find . -name ".py | xargs cat
:获取.py文件的内容- xargs将stdin的内容用空行隔开,作为cat的命令行参数,传给cat
- cat a.txt b.txt
- stdin 变成文件参数
环境变量
概念
-
Linux系统中会用很多环境变量来记录配置信息。
-
环境变量类似于全局变量,可以被各个进程访问到。我们可以通过修改环境变量来方便地修改系统配置。
查看
- 列出当前环境下的所有环境变量:
env # 显示当前用户的变量
set # 显示当前shell的变量,包括当前用户的变量;
export # 显示当前导出成用户变量的shell变量
echo $PATH # 输出某个环境变量的值
修改
-
环境变量的定义、修改、删除操作可以参考Linux-03shell语法这一节的内容。
-
为了将对环境变量的修改应用到未来所有环境下,可以将修改命令放到
~/.bashrc
文件中。 -
修改完
~/.bashrc
文件后,记得执行source ~/.bashrc
,来将修改应用到当前的bash环境下。 -
为何将修改命令放到
~/.bashrc
,就可以确保修改会影响未来所有的环境呢?- 每次启动bash,都会先执行
~/.bashrc
。 - 每次ssh登陆远程服务器,都会启动一个bash命令行给我们。
- 每次tmux新开一个pane,都会启动一个bash命令行给我们。
- 所以未来所有新开的环境都会加载我们修改的内容。
- 每次启动bash,都会先执行
常见环境变量
HOME
:用户的家目录。PATH
:可执行文件(命令)的存储路径。路径与路径之间用:
分隔。当某个可执行文件同时出现在多个路径中时,会选择从左到右数第一个路径中的执行。下列所有存储路径的环境变量,均采用从左到右的优先顺序。
# 将march-server变成命令
# 1. 将pwd的路径复制
# 2. 修改~/.bashrc
vim .bashrc
# PATH取出之前的PATH内容,将pwd接到之前PATH的后面
export PATH=pwd:PATH
# 3. 应用~/.bashrc
source .bashrc
LD_LIBRARY_PATH
:用于指定动态链接库(.so文件)的路径,其内容是以冒号分隔的路径列表。C_INCLUDE_PATH
:C语言的头文件路径,内容是以冒号分隔的路径列表。CPLUS_INCLUDE_PATH
:CPP的头文件路径,内容是以冒号分隔的路径列表。PYTHONPATH
:Python导入包的路径,内容是以冒号分隔的路径列表。JAVA_HOME
:jdk的安装目录。CLASSPATH
:存放Java导入类的路径,内容是以冒号分隔的路径列表。
Linux常用命令补充
Linux命令非常多,本节讲解几个常用命令。其他命令依赖于大家根据实际操作环境,边用边查。
系统状况
-
top
:查看所有进程的信息(Linux的任务管理器)- 打开后,输入M:按使用内存排序
- 打开后,输入P:按使用CPU排序
- 打开后,输入q:退出
-
df -h
:查看硬盘使用情况 -
free -h
:查看内存使用情况 -
du -sh
:查看当前目录占用的硬盘空间 -
ps aux
:查看所有进程ps -aux
:查看进程的CPU占用率和内存占用率ps -ef
:查看进程的父进程ID
-
kill -9 pid
:杀死编号为pid的进程- 传递某个具体的信号:
kill -s SIGTERM pid
- 传递某个具体的信号:
-
netstat -nt
:查看所有网络连接netstat -nlp | grep 22
:查看22端口号是否被占用sudo netstat -nltp
:检测TCP/IP网络连接的监听端口(网络端口监听)- 过时了:
ss -nt
:查看所有网络连接
-
w
:列出当前登陆的用户 -
ping www.baidu.com
:检查是否连网
文件权限
chmod
:修改文件权限chmod +x xxx
:给xxx添加可执行权限chmod -x xxx
:去掉xxx的可执行权限chmod 777 xxx
:将xxx的权限改成777chmod 777 xxx -R
:递归修改整个文件夹的权限
文件检索
- find /path/to/directory/ -name '*.py'
:搜索某个文件路径下的所有*.py文件
-
grep xxx
:从stdin中读入若干行数据,如果某行中包含xxx,则输出该行;否则忽略该行。 -
wc
:统计行数、单词数、字节数- 既可以从stdin中直接读入内容;也可以在命令行参数中传入文件名列表;
wc -l
:统计行数wc -w
:统计单词数wc -c
:统计字节数
-
tree
:展示当前目录的文件结构tree /path/to/directory/
:展示某个目录的文件结构tree -a
:展示隐藏文件
-
ag xxx
:搜索当前目录下的所有文件,检索xxx字符串 -
cut
:分割一行内容- 从stdin中读入多行数据
echo $PATH | cut -d ':' -f 3,5
:输出PATH用:分割后第3、5列数据echo $PATH | cut -d ':' -f 3-5
:输出PATH用:分割后第3-5列数据echo $PATH | cut -c 3,5
:输出PATH的第3、5个字符echo $PATH | cut -c 3-5
:输出PATH的第3-5个字符
-
sort
:将每行内容按字典序排序- 可以从stdin中读取多行数据
- 可以从命令行参数中读取文件名列表
-
xargs
:将stdin中的数据用空格或回车分割成命令行参数find . -name '*.py' | xargs cat | wc -l
:统计当前目录下所有python文件的总行数
查看文件内容
-
more
:浏览文件内容- 回车:下一行
- 空格:下一页
- b:上一页
- q:退出
-
less
:与more类似,功能更全- 回车:下一行
- y:上一行
- Page Down:下一页
- Page Up:上一页
- q:退出
-
head -3 xxx
:展示xxx的前3行内容- 同时支持从stdin读入内容
-
tail
:展示文件末尾内容tail -3 xxx
:展示xxx末尾3行内容tail -n 5 文件
:查看文件尾部5行内容 (常用于日志)tail -f 文件
:实时追踪该文档的所有更新 (常用于 flum 采集数据)- 同时支持从stdin读入内容
用户相关
history
:展示当前用户的历史操作。内容存放在~/.bash_history中
工具
-
md5sum
:计算md5哈希值- 可以从stdin读入内容
- 也可以在命令行参数中传入文件名列表;
-
time command
:统计command命令的执行时间 -
ipython3
:交互式python3环境。可以当做计算器,或者批量管理文件。! echo "Hello World"
:!表示执行shell脚本
-
watch -n 0.1 command
:每0.1秒执行一次command命令 -
tar
:压缩文件tar -zcvf xxx.tar.gz /path/to/file/*
:压缩tar -zxvf xxx.tar.gz
:解压缩tar -zxvf xxx.tar.gz -C yyy
:可以将 xxx.tar.gz 解压到指定目录 yyy 中,x - extract。
-
diff xxx yyy
:查找文件xxx与yyy的不同点
安装软件
-
sudo command
:以root身份执行command命令 -
apt-get install xxx
:安装软件
centos下:yum install
,yum -y install
:这个指令不用自己手动输入 y -
pip install xxx --user --upgrade
:安装python包
作业
2. 创建作业 & 测试作业的正确性
homework 7 create 可以重新创建所有lesson_7的作业
homework 7 create id 可以单独创建lesson_7的第id个作业. e.g.
homework 7 create 0 可以只重新创建lesson_7的第0个作业
homework 7 test 可以评测lesson_7的所有作业
3. 作业
创建好作业后,先进入文件夹/home/acs/homework/lesson_7/,然后:
(0) 进入homework_0文件夹,然后:
[1] 编写可执行shell脚本,文件名为mydu,使得在任意目录执行该脚本后,可以输出当前目录所占用的磁盘空间大小,格式化输出(例如 1K, 234M, 2G)。
[2] 修改环境变量PATH,使得在任意目录下输入mydu均可执行上述脚本。
(1) 进入homework_1文件夹,然后:
[1] 给当前目录下的所有文件添加可读权限。
[2] 统计当前目录下共有多少个以.cpp结尾的文件,将结果写入ans.txt中。
(2) 进入homework_2文件夹,然后:
[1] 统计当前目录下所有cpp文件的总行数,将结果写入ans1.txt中。
[2] 遍历当前目录下所有py文件,统计共有多少行包含字符串thrift,将结果写入ans2.txt中。
(3) 进入homework_3文件夹,然后删除当前目录下的所有py文件。
(4) 进入homework_4文件夹,然后:
[1] 当前目录下包含一个文件scores.txt,文件中有若干行数据,每行数据包含用空格隔开的3个字段:姓名、数学成绩、算法成绩。
[2] 将scores.txt文件的内容以空格为分隔符分隔成3列,将第一列内容写入names.txt,第二列内容写入mathematics.txt,第三列内容写入algorithm.txt。
注意:scores.txt文件本身不要修改。
(5) 进入homework_5文件夹,然后:
[1] 当前目录下包含一个文件scores.txt,文件中有若干行数据,每行数据包含用空格隔开的3个字段:姓名、数学成绩、算法成绩。
[2] 将scores.txt文件的内容以空格为分隔符分隔成3列,将第一列内容按字典序从小到大排序后写入names.txt。
注意:scores.txt文件本身不要修改。
(6) 进入homework_6文件夹,然后将scores.txt文件的前5行写入top.txt,后4行写入bottom.txt。
(7) 进入homework_7文件夹,计算scores.txt文件的md5sum,将结果写入ans.txt。注意:ans.txt文件中只包含长度为32的md5sum,不包含其他内容。
(8) 进入homework_8文件夹,然后:
[1] 将dir_a文件夹压缩为project_a.tar.gz。
[2] 将project_b.tar.gz压缩文件解压到当前目录。
注意:不要删除dir_a文件夹和project_b.tar.gz文件。
(9) 进入homework_9文件夹,然后计算 2112+378
2
112
+
3
78
,将结果写入ans.txt中。