《Unix/Linux系统编程》第一、二章读书笔记

自学教材1、2章学习笔记

一、任务要求

学教材第1，2章，提交学习笔记（10分）
- 知识点归纳以及自己最有收获的内容（3分）
- 问题与解决思路（2分）
- 实践内容与截图，代码链接（3分）
- 知识的结构化，知识的完整性等，提交markdown文档，使用openeuler系统等（2分）

二、知识归纳

第一章

（0）书籍实现目标：

提供高级编程所需背景知识和技能
了解软件工具、程序开发步骤和程序执行的运行时环境，开发步骤包括汇编器、编译器、链接器、链接库、可执行文件内容、程序执行影响、函数调用约定、参数传递方案、局部变量、栈帧、C程序和汇编代码链接、程序终止和异常处理、Makefile和GDB的使用
第二周的课堂上老师重点讲解了C程序源代码转换成可执行文件的全过程，这其中第一步是通过gcc -E命令将源代码使用编译器转换成.i文件（预处理），再通过gcc -S命令通过将.i文件转换成.s的汇编程序，之后通过gcc -c命令将.s文件转换成.o的目标文件（二进制机器码），最后用链接器-o将目标文件变为可执行文件。（记忆方法：ESc，iso）
动态数据结构应用
用二叉树模拟Unix/Linux文件系统树，支持pwd、ls、cd、mkdir等操作。
进程管理
各种进程的抽象。创建进程、按优先级调度进程、通过上下文切换运行不同进程、通过二叉树维护进程关系、使用sleep和wakeup原语实现等待子进程终止等。进程管理包括fork()，exit()，wait()，exit()等。还包括I/O重定向和管道。
并发编程
Pthreads编程，线程连接、互斥量、条件变量、信号量、屏障。
定时器和定时功能
信号处理和进程间通信
文件系统
TCP/IP和网络编程

（1）安装虚拟机

用户登录

（2）Ubuntu Linux的使用

命令执行规则：用户进程通常会执行命令解释程序sh，后者将提示用户执行命令。sh将直接执行一些特殊命令，（cd , exit , logout , &）非特殊命令通常是可执行文件。对于非特殊命令，sh会复刻子进程并等待该子进程终止。子进程会将其执行映像更改为文件，并执行新映像。子进程终止时会唤醒父进程sh，后者将执行另一个命令等。除简单命令，sh还支持 I/O 重定向和通过管道连接的符合命令。除内置命令外，用户还可以开发程序，将其编译为二进制的可执行文件，并按照命令运行程序。

Ubuntu Linux 的特性

1、Ubuntu 的使用需要输入用户名和密码创建一个默认目录为 ”/home/username“ 的用户账号。当Ubuntu启动时，会自动登录默认用户

Ctrl+Alt+T 打开伪终端

每次开启一个新终端都是运行一个sh，提示用户执行新的命令

2、出于安全考虑，用户应为普通用户，而不是根用户或者超级用户，要运行任何特权命令，需要输入：

sudo command

//但是会验证用户的密码。

3、用户的 “PATH” （路径）环境变量设置通常不包括用户的当前目录。当前目录下运行程序，用户需要每次都输入：

./a.out

所以为了方便起见，用户应更改路径设置，已包含当前目录，在用户主目录中，创建一个包括以下代码的 .bashrc 文件：

PATH=$PATH:./

用户每次打开伪终端时，sh 都会先执行.bashrc文件来设置路径，以包含当前工作目录。

4、Ubuntu 支持有线和无线网络连接

（3）命令执行

第二章

（1）文本编辑器

教材中介绍了vim、gedit以及emacs三种编辑器，在课程中主要学习vim编辑器

（2）下载并使用emacs

问题：进行emacs的操作时，出现无法获得锁的情况

按照教程得以解决

无法获得锁 /var/lib/dpkg/lock-frontend。锁正由进程 106164（unattended-upgr）持有 N: 请注意，直接移除锁文件不一定是合适的解决方案，且可能损坏您的系_程序员界的小趴菜的博客-CSDN博客

输入emacs [FILENAME]打开emacs

输入c语言代码

（3）在Linux环境下运行C语言代码

创建一个名为test的c语言文件，输入“i”编辑文件，编辑结束后esc推出编辑，输入“：wq”退出并保存文件

此时出现一个小问题：没有安装gcc，则输入sudo apt install gcc安装

手把手教你搭建Linux开发环境（VMware+Ubuntu）（四）——gcc编译器的安装和使用_JinrongLiang的博客-CSDN博客_ubuntu查看编译器版本

安装完毕后即可实现c语言功能

（4）程序开发步骤分析

C语言程序中的变量可分为全局变量、局部变量、自动变量和寄存器变量等。
在大一C语言的课堂上，我们有详细了解过全局变量、局部变量，而在这里我了解到局部变量在默认情况下就是自动变量，编译器试图把寄存器变量存在CPU寄存器中，易失性变量用作内存映射I/O的地址或者通过中断处理程序或多个执行线程来访问的全局变量，易失性关键字可以阻止C编译器优化用这些变量进行操作的代码。
gcc三个步骤：将源文件转换为汇编代码（编译），将汇编代码转换成目标代码（汇编），将目标代码转换成二进制可执行文件（链接）
.o（汇编）文件包含
- 一个文件头，包含代码段、数据段和BSS段的大小
- 一个代码段，包含机器指令
- 一个数据段，包含初始化全局变量和初始化静态局部变量
- 一个BSS段，包含未初始化全局变量和未初始化静态局部变量
- 代码中的指针以及数据和BSS中的偏移量的重定位信息
- 一个符号表，包含非静态全局变量、函数名称及其属性
静态和动态链接
在使用静态库的静态链接中，链接器将所有必要的库函数代码和数据纳入a.out文件中。在执行动态链接的a.out文件时，操作系统将a.out文件和共享库均加载到内存中，使加载的库代码在执行期间可供a.out文件访问。
动态链接的主要优点：可减小每个a.out文件的大小，许多执行程序可在内存中共享相同的库函数，修改苦不需要重新编译源文件。
动态链接所用的库成为动态链接库（DLL）。它们在Linux中成为共享库（.so文件）。动态加载（DL）库是指仅按需加载的共享库。动态加载库可用作插件和动态加载模块。
可执行文件
- 二进制可执行平面文件
  包含可执行代码和初始化数据
- a.out可执行文件
  传统的a.out文件包含文件头（包含文件的加载信息和大小，tsize = 代码段大小，dsize = 数据段大小，bsize = bss段大小，total——size = 加载的a.out文件总大小），然后是代码段（正文段，从标准C启动代码crt0.o开始，改代码调用main()函数）、数据段、bss段、符号表（可选）
  符号“_brk”表示bss段结束。a.out文件的总加载大小通常等于_brk（即tszie+dsize+bsize）。如果需要，_brk可以设置为更高值。
- ELF可执行文件
  可执行的链接格式文件，包含一个或多个程序段，每个程序段均可可加载至特定的内存地址。在Linux中，默认的二进制可执行文件为ELF文件。

GDB调试工具

GDB断点设置指令总结：

（5）程序执行过程

在类Unix操作系统中，在sh命令行 a.out one two three

执行a.out文件，以标记字符串作为命令行参数。
为执行命令，sh创建一个子进程并等待改子进程终止。子进程运行时，sh使用a.out文件执行新的执行映像

读取a.out文件头
```
  Total_Size = _brk + stackSize
```
普通的C语言程序将因为任一计算机上的堆栈溢出而产生分段错误（因此操作系统通常使用待启动程序的默认初始堆栈大小）
sh从总大小中分配一个内存区给执行映像。
sh放弃旧映像，开始执行新映像。
执行从crt0.o开始，调用main()，将argc和argv作为参数传递给main()，可以写成
```
  int main(int argc, char *argv[]){ … }
```

（6）程序终止

正常终止
如果程序执行成功，main()最终会返回到crt0.out，调用库函数exit(0)来终止进程。
exit(value)函数会执行一些清理请求，如刷新stdout、关闭I/O流等，然后发出一个_exit(value)系统调用，是进入操作系统内核的进程终止。退出值0通常表示正常终止。如需要，进程也可直接调用exit(value)。再直接一点，进程可能会发出_exit(value)系统调用以立即终止。
内核中某个进程终止时，会在父进程结构体中将_exit(value)系统调用值记录为退出状态，通知其父进程并使该进程变为僵尸进程，父进程可通过系统调用
```
  pid = wait(int *status);
```

找到僵尸子进程，获得其pid和退出状态，并清空僵尸子进程的结构体，使该结构体可以被另一个进程重新使用。

异常终止
常见的有无效地址、非法指令、越权等。
当某进程遇到异常时，它会陷入操作系统内核，内核的陷入处理程序将陷入错误类型转换为一个幻数（即信号。）
除了错误导致的陷入，信号也可来自硬件或其他进程。
如“Ctrl+C”组合键会产生硬件中断（向终端上所有进程发送数字2的信号SIGINT），（INT即为Linux中断），或者用户可使用命令
```
  kill -s signal_number pid # signal_number = 1 to 31
```

向pid识别的目标进程发送信号。
对于大多数信号数值，进程的默认操作是终止。

（7）C语言背景

C语言结构体

（1）结构体是包括变量或数据对象集合的复合数据类型。C语言结构体类型由 struct 关键字定义。

next：指向下一个节点结构体的指针；

key：一个整数；

name：一个由64个字符组成的数组。

（2）定义结构体时，该结构体的每个字段都必须具有一个·1编译器已知的类型，但自引用指针除外；

每个C语言结构体数据对象都分配了一个连续内存块。C语言结构体的单个字段通过使用 .operater (.运算符)访问。

x.next:指向另一个NODE类型对象的指针；

x.key：这是一个整数；

x.name：这是64个字符组成的数组。

运行时，每个字段相对于结构体起始地址的偏移量进行访问。

（3）一个结构体的大小可以根据sizeof（struct type）确定。C编译器将计算该结构体的总字节数大小。由于内存排列受限制，C编译器可能会用额外字节填充结构体的某些字段。如果需要，用户可以用PACKED属性定义C语言结构体。

（4）假设“NODE x , y"为两个相同类型的结构体，除了复制粘贴，还可以通过C语句y=x 将 x 分配给 y ；

（5）C语言联合体与结构体类似。要定义一个联合体，只需要将关键字 struct 替换成关键字union

编程项目：Unix/Linux文件系统树模拟器

文件树通常是上下颠倒的，根节点在上面。

为了安全起见，假设文件系统只包括目录（DIR）和常规文件（FILE），即没有特殊文件，这些文件是I/O设备。

在Linux文件系统中，每个节点都由表单 /a/b/c 或 a/b/c的唯一路径名表示。以“/"开头表示绝对路径，说明从根开始，否则为相对于当前工作目录（CWD）的相对路径。

命令规范

mkdir 路径名：为给定的路径名创建一个新目录

rmdir 路径名：如果目录为空，则删除该目录

creat 路径名：创建一个FILE结点

rm路径名：删除一个FILE节点

save 文件名：将当前文件系统树保存为文件

reload 文件名：从一个文件构造一个文件系统树

menu:显示有效命令菜单

quit：保存文件系统树，然后终止程序

posted @ 2022-09-04 19:34 20201231黄若琪阅读(81) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

20201231黄若琪