《Unix/Linux系统编程》第一、二章读书笔记

自学教材1、2章学习笔记

一、任务要求

  • 学教材第1,2章,提交学习笔记(10分)
    • 知识点归纳以及自己最有收获的内容 (3分)
    • 问题与解决思路(2分)
    • 实践内容与截图,代码链接(3分)
    • 知识的结构化,知识的完整性等,提交markdown文档,使用openeuler系统等(2分)

二、知识归纳

第一章

(0)书籍实现目标:

    • 提供高级编程所需背景知识和技能
      了解软件工具、程序开发步骤和程序执行的运行时环境,开发步骤包括汇编器、编译器、链接器、链接库、可执行文件内容、程序执行影响、函数调用约定、参数传递方案、局部变量、栈帧、C程序和汇编代码链接、程序终止和异常处理、Makefile和GDB的使用
      第二周的课堂上老师重点讲解了C程序源代码转换成可执行文件的全过程,这其中第一步是通过gcc -E命令将源代码使用编译器转换成.i文件(预处理),再通过gcc -S命令通过将.i文件转换成.s的汇编程序,之后通过gcc -c命令将.s文件转换成.o的目标文件(二进制机器码),最后用链接器-o将目标文件变为可执行文件。(记忆方法:ESc,iso)
    • 动态数据结构应用
      用二叉树模拟Unix/Linux文件系统树,支持pwd、ls、cd、mkdir等操作。
    • 进程管理
      各种进程的抽象。创建进程、按优先级调度进程、通过上下文切换运行不同进程、通过二叉树维护进程关系、使用sleep和wakeup原语实现等待子进程终止等。进程管理包括fork(),exit(),wait(),exit()等。还包括I/O重定向和管道。
    • 并发编程
      Pthreads编程,线程连接、互斥量、条件变量、信号量、屏障。
    • 定时器和定时功能
    • 信号处理和进程间通信
    • 文件系统
    • TCP/IP和网络编程

(1)安装虚拟机

用户登录

(2)Ubuntu Linux的使用

        命令执行规则:用户进程通常会执行命令解释程序sh,后者将提示用户执行命令。sh将直接执行一些特殊命令,(cd , exit , logout , &)非特殊命令通常是可执行文件。对于非特殊命令,sh会复刻子进程并等待该子进程终止。子进程会将其执行映像更改为文件,并执行新映像。子进程终止时会唤醒父进程sh,后者将执行另一个命令等。除简单命令,sh还支持 I/O 重定向和通过管道连接的符合命令。除内置命令外,用户还可以开发程序,将其编译为二进制的可执行文件,并按照命令运行程序。

 

Ubuntu Linux 的特性

    1、Ubuntu 的使用需要输入用户名和密码创建一个默认目录为 ”/home/username“ 的用户账号。当Ubuntu启动时,会自动登录默认用户

         ​ Ctrl+Alt+T 打开伪终端

 

每次开启一个新终端都是运行一个sh,提示用户执行新的命令

    2、出于安全考虑,用户应为普通用户,而不是根用户或者超级用户,要运行任何特权命令,需要输入:

​ sudo command

​ //但是会验证用户的密码。

    3、用户的 “PATH” (路径)环境变量设置通常不包括用户的当前目录。当前目录下运行程序,用户需要每次都输入:

​ ./a.out

所以为了方便起见,用户应更改路径设置,已包含当前目录,在用户主目录中,创建一个包括以下代码的 .bashrc 文件:

​ PATH=$PATH:./

用户每次打开伪终端时,sh 都会先执行.bashrc文件来设置路径,以包含当前工作目录。

    4、Ubuntu 支持有线和无线网络连接

(3)命令执行

 

 

 

第二章

(1)文本编辑器

教材中介绍了vim、gedit以及emacs三种编辑器,在课程中主要学习vim编辑器

 

(2)下载并使用emacs

问题:进行emacs的操作时,出现无法获得锁的情况

 

按照教程得以解决

无法获得锁 /var/lib/dpkg/lock-frontend。锁正由进程 106164(unattended-upgr)持有 N: 请注意,直接移除锁文件不一定是合适的解决方案,且可能损坏您的系_程序员界的小趴菜的博客-CSDN博客

 

输入emacs [FILENAME]打开emacs

 

 

 输入c语言代码

 

 

(3)在Linux环境下运行C语言代码

创建一个名为test的c语言文件,输入“i”编辑文件,编辑结束后esc推出编辑,输入“:wq”退出并保存文件

 

 

 

 

此时出现一个小问题:没有安装gcc,则输入sudo apt install gcc安装

手把手教你搭建Linux开发环境(VMware+Ubuntu)(四)——gcc编译器的安装和使用_JinrongLiang的博客-CSDN博客_ubuntu查看编译器版本

 

 

 

 

 

 安装完毕后即可实现c语言功能

(4)程序开发步骤分析

    • C语言程序中的变量可分为全局变量、局部变量、自动变量寄存器变量等。
      在大一C语言的课堂上,我们有详细了解过全局变量、局部变量,而在这里我了解到局部变量在默认情况下就是自动变量,编译器试图把寄存器变量存在CPU寄存器中,易失性变量用作内存映射I/O的地址或者通过中断处理程序或多个执行线程来访问的全局变量,易失性关键字可以阻止C编译器优化用这些变量进行操作的代码。
    • gcc三个步骤:将源文件转换为汇编代码(编译),将汇编代码转换成目标代码(汇编),将目标代码转换成二进制可执行文件(链接)
    • .o(汇编)文件包含
      • 一个文件头,包含代码段、数据段和BSS段的大小
      • 一个代码段,包含机器指令
      • 一个数据段,包含初始化全局变量和初始化静态局部变量
      • 一个BSS段,包含未初始化全局变量和未初始化静态局部变量
      • 代码中的指针以及数据和BSS中的偏移量的重定位信息
      • 一个符号表,包含非静态全局变量、函数名称及其属性
    • 静态和动态链接
      在使用静态库的静态链接中,链接器将所有必要的库函数代码和数据纳入a.out文件中。在执行动态链接的a.out文件时,操作系统将a.out文件和共享库均加载到内存中,使加载的库代码在执行期间可供a.out文件访问。
      动态链接的主要优点:可减小每个a.out文件的大小,许多执行程序可在内存中共享相同的库函数,修改苦不需要重新编译源文件。
      动态链接所用的库成为动态链接库(DLL)。它们在Linux中成为共享库(.so文件)。动态加载(DL)库是指仅按需加载的共享库。动态加载库可用作插件和动态加载模块。
    • 可执行文件
      • 二进制可执行平面文件
        包含可执行代码和初始化数据
      • a.out可执行文件
        传统的a.out文件包含文件头(包含文件的加载信息和大小,tsize = 代码段大小,dsize = 数据段大小,bsize = bss段大小,total——size = 加载的a.out文件总大小),然后是代码段(正文段,从标准C启动代码crt0.o开始,改代码调用main()函数)、数据段、bss段、符号表(可选)
        符号“_brk”表示bss段结束。a.out文件的总加载大小通常等于_brk(即tszie+dsize+bsize)。如果需要,_brk可以设置为更高值。
      • ELF可执行文件
        可执行的链接格式文件,包含一个或多个程序段,每个程序段均可可加载至特定的内存地址。在Linux中,默认的二进制可执行文件为ELF文件。

 

GDB调试工具

GDB断点设置指令总结:

(5)程序执行过程

在类Unix操作系统中,在sh命令行 a.out one two three

执行a.out文件,以标记字符串作为命令行参数
为执行命令,sh创建一个子进程并等待改子进程终止。子进程运行时,sh使用a.out文件执行新的执行映像

  • 读取a.out文件头

      Total_Size = _brk + stackSize
    

    普通的C语言程序将因为任一计算机上的堆栈溢出而产生分段错误(因此操作系统通常使用待启动程序的默认初始堆栈大小)

  • sh从总大小中分配一个内存区给执行映像。

  • sh放弃旧映像,开始执行新映像。

  • 执行从crt0.o开始,调用main(),将argc和argv作为参数传递给main(),可以写成

      int main(int argc, char *argv[]){ … }
    

(6)程序终止

  • 正常终止
    如果程序执行成功,main()最终会返回到crt0.out,调用库函数exit(0)来终止进程。
    exit(value)函数会执行一些清理请求,如刷新stdout、关闭I/O流等,然后发出一个_exit(value)系统调用,是进入操作系统内核的进程终止。退出值0通常表示正常终止。如需要,进程也可直接调用exit(value)。再直接一点,进程可能会发出_exit(value)系统调用以立即终止。
    内核中某个进程终止时,会在父进程结构体中将_exit(value)系统调用值记录为退出状态,通知其父进程并使该进程变为僵尸进程,父进程可通过系统调用

      pid = wait(int *status);
    

找到僵尸子进程,获得其pid和退出状态,并清空僵尸子进程的结构体,使该结构体可以被另一个进程重新使用。

  • 异常终止
    常见的有无效地址、非法指令、越权等。
    当某进程遇到异常时,它会陷入操作系统内核,内核的陷入处理程序将陷入错误类型转换为一个幻数(即信号。)
    除了错误导致的陷入,信号也可来自硬件或其他进程。
    如“Ctrl+C”组合键会产生硬件中断(向终端上所有进程发送数字2的信号SIGINT),(INT即为Linux中断),或者用户可使用命令

      kill -s signal_number pid # signal_number = 1 to 31
    

向pid识别的目标进程发送信号。
对于大多数信号数值,进程的默认操作是终止

(7)C语言背景

 

 

C语言结构体

(1)结构体是包括变量或数据对象集合的复合数据类型。C语言结构体类型由 struct 关键字定义。

next:指向下一个节点结构体的指针;

key:一个整数;

name:一个由64个字符组成的数组。

(2)定义结构体时,该结构体的每个字段都必须具有一个·1编译器已知的类型,但自引用指针除外;

每个C语言结构体数据对象都分配了一个连续内存块。C语言结构体的单个字段通过使用 .operater (.运算符)访问。

x.next:指向另一个NODE类型对象的指针;

x.key:这是一个整数;

x.name:这是64个字符组成的数组。

运行时,每个字段相对于结构体起始地址的偏移量进行访问。

(3)一个结构体的大小可以根据sizeof(struct type)确定。C编译器将计算该结构体的总字节数大小。由于内存排列受限制,C编译器可能会用额外字节填充结构体的某些字段。如果需要,用户可以用PACKED属性定义C语言结构体。

(4)假设“NODE x , y"为两个相同类型的结构体,除了复制粘贴,还可以通过C语句y=x 将 x 分配给 y ;

(5)C语言联合体与结构体类似。要定义一个联合体,只需要将关键字 struct 替换成关键字union

编程项目:Unix/Linux文件系统树模拟器

文件树通常是上下颠倒的,根节点在上面。

为了安全起见,假设文件系统只包括目录(DIR)和常规文件(FILE),即没有特殊文件,这些文件是I/O设备。

在Linux文件系统中,每个节点都由表单 /a/b/c 或 a/b/c的唯一路径名表示。以“/"开头表示绝对路径,说明从根开始,否则为相对于当前工作目录(CWD)的相对路径。

命令规范

mkdir 路径名:为给定的路径名创建一个新目录

rmdir 路径名:如果目录为空,则删除该目录

creat 路径名:创建一个FILE结点

rm路径名:删除一个FILE节点

save 文件名:将当前文件系统树保存为文件

reload 文件名:从一个文件构造一个文件系统树

menu:显示有效命令菜单

quit:保存文件系统树,然后终止程序

posted @ 2022-09-04 19:34  20201231黄若琪  阅读(81)  评论(0编辑  收藏  举报