20135234mqy-——信息安全系统设计基础第十三周学习总结
第十一章 网络编程
11.1 客户端-服务器编程模型
基本操作:事务
当一个客户端需要服务时,向服务器发送一个请求,发起一个事务。
服务器收到请求后,解释它,并以适当的方式操作它的资源。
服务器给客户端发送一个相应,并等待下一个请求。
客户端收到响应并处理它。
11.2 网络
(1)对主机而言:网络是一种I/O设备
从网络上接收到的数据从适配器经过I/O和存储器总线拷贝到存储器,典型地是通过DMA(直接存储器存取方式)传送。
(2)物理上:网络是一个按照地理远近组成的层次系统
最底层:LAN(局域网),最流行的是以太网,
以太网段:
包括一些电缆和集线器。每根电缆都有相同的最大位带宽,集线器不加分辩地将一个端口上收到的每个位复制到其他所有的端口上,因此每台主机都能看到每个位。
每个以太网适配器都有一个全球唯一的48位地址,存储在适配器的非易失性存储器上。
一台主机可以发送一段位:帧,到这个网段内其它任何主机。每个帧包括一些固定数量的头部位(标识此帧的源和目的地址及帧长)和数据位(有效载荷)。每个主机都能看到这个帧,但是只有目的主机能读取。
使用电缆和网桥,多个以太网段可以连接成较大的局域网,称为桥接以太网。这些电缆的带宽可以是不同的。
多个不兼容的局域网可以通过叫做路由器的特殊计算机连接起来,组成一个internet互联网络。
(3)协议
互联网重要特性:由采用不同技术,互不兼容的局域网和广域网组成,并能使其相互通信。其中不同网络相互通信的解决办法是一层运行在每台主机和路由器上的协议软件,消除不同网络的差异。
协议提供的两种基本能力
命名机制:唯一的标示一台主机
传送机制:定义一种把数据位捆扎成不连续的片的同一方式
11.3 全球IP因特网
TCP/IP协议族
混合使用套接字接口函数和UnixI/O函数进行通信
世界范围的主机集合
特性:
主机集合被映射为一组32位的IP地址
这组IP地址被映射为一组称为因特网域名的标识符
因特网主机上的进程能够通过连接和任何其他主机上的进程
11.4 套接字接口
11.4.1函数
socket函数
connect函数
open_clientfd函数
bind函数
listen函数
open_listenfd函数
accept函数
11.4.2 echo客户端和服务器示例
11.5 Web服务器
11.5.1 Web基础
Web 客户端和服务器之间的交互用的是一个基于文本的应用级协议,叫做 HTTP (Hypertext Transfer Protocol,超文本传输协议). HTTP 是一个简单的协议。一个Web 客户端(即浏览器) 打开一个到服务器的因特网连接,并且请求某些内容。服务器响应所请求的内容,然后关闭连接。浏览器读取这些内容,并把它显示在屏幕上。
11.5.2 Web内容
Web内容可以用一种叫做 HTML(Hypertext Markup Language,超文本标记语言)的语言来编写。一个 HTML 程序(页)包含指令(标记),它们告诉浏览器如何显示这页中的各种文本和图形对象。
Web服务器以两种不同的方式向客户端提供内容:
(1)取一个磁盘文件,并将它的内容返回给客户端。磁盘文件称为静态内容 (static content), 而返回文件给客户端的过程称为服务静态内容 (serving staticcontent)。
(2)运行一个可执行文件,并将它的输出返回给客户端。运行时可执行文件产生的输出称为态内容 (dynamic content),而运行程序并返回它的输出到客户端的过程称为服务动态内容 (serving dynamic content)。
第十二章 并发编程
现在操作系统提供了三种基本的构造并发程序的方法:
进程。每个逻辑控制流都是一个进程,由内核来调度和维护。
I/O多路复用。
线程。
12.1 基于进程的并发编程
在接受连接请求之后,服务器派生出一个子进程,这个子进程获得服务器描述表完整的拷贝。子进程关闭它的拷贝中监听描述符3,父进程关闭它的已连接描述符4的拷贝,因为不需要这些描述符了。
通常服务器会运行很长时间,所以需要一个SIGCHLD处理程序,来回收僵死进程。因为当SIGCHLD执行时,信号是阻塞的,而UNIX信号是不排队的,所以SIGCHLD必须准备好回收多个僵死进程。
循环中的父进程和子进程关闭各自需要关闭的描述符。
进程能够共享文件表,但不共享用户地址空间。
12.2 基于I/O多路复用的并发编程
面对困境——服务器必须响应两个互相独立的I/O事件:
(1)网络客户端发起的连接请求
(2)用户在键盘上键入的命令 ,解决的办法是I/O多路复用技术。基本思想是,使用select函数,要求内核挂起进程,只有在一个或多个I/O事件发生后,才将控制返回给应用程序。
12.2.1基于I/O多路复用的并发事件驱动服务器
(1)I/O多路复用可以用做并发事件驱动程序的基础,在事件驱动程序中,流是因为某种事件而前进的,一般概念是把逻辑流模型化为状态机。一个 状态机就是一组状态、输入事件和转移。
(2)并发事件驱动程序中echo服务器中逻辑流的状态机
12.3基于线程的并发编程
12.3.1 线程执行模型
(1)线程运行在进程上下文中的逻辑流。线程由内核自动调度,每个线程都有它自己的线程上下文。
(2)线程执行模型。多线程的执行模型在某些方面和多进程的执行模型相似。每个进程开始生命周期时都是单一线程,这个线程称为主线程。在某 一时刻,主线程创建一个对等线程,从在此刻开始,两个线程就并发地运行。
12.3.2 Posix线程
创建线程:
获取自身ID:
终止线程:
12.3.5回收已终止线程的资源:
pthread_join函数会终止,直到线程tid终止。和wait不同,该函数只能回收指定id的线程,不能回收任意线程。
12.3.6 分离线程:
一个可结合的线程能够被其他线程回收其资源和杀死,在被其他线程回收之前,它的存储其资源是没有被释放的;相反,一个分离的线程是不能被其他线程回收或杀死的。它的存储器资源是在它终止时系统自动释放的。默认情况下,线程被创建成可结合的。
12.3.7 初始化线程:
该函数用来初始化多个线程共享的全局变量。
12.4多线程程序中的共享变量
- 每个线程都有它自己独自的线程上下文,包括线程ID、栈、栈指针、程序计数器、条件码和通用目的寄存器值。
- 每个线程和其他线程一起共享进程上下文的剩余部分。寄存器是从不共享的,而虚拟存储器总是共享的。
- 线程化的c程序中变量根据它们的存储器类型被映射到虚拟存储器:全局变量,本地自动变量(不共享),本地静态变量。
12.5 用信号量同步线程
12.5.2信号量
用信号量解决同步问题,信号量s是具有非负整数值的全局变量,有两种特殊的操作来处理(P和V):
12.5.3使用信号量实现互斥
12.5.4利用信号量调度共享资源
(1)生产者——消费者问题
保证对缓冲区的访问是互斥的;还需要调度对缓冲区的访问,即,如果缓冲区是满的(没有空的槽位),那么生产者必须等待直到有一个空的槽位为止,如果缓冲区是空的(即没有可取的项目),那么消费者必须等待直到有一个项目变为可用。
(2)读者——写者问题
- 修改对象的线程叫做写者;只读对象的线程叫做读者。
- 写者必须拥有对对象的独占访问,而读者可以和无限多个其他读者共享对象。
-
读者——写者问题基本分为两类:
第一类,读者优先,要求不要让读者等待,除非已经把使用对象的权限赋予了一个写者。换句话说,读者不会因为有一个写者等待而等待;
第二类,写者优先,要求一定能写者准备好可以写,它就会尽可能地完成它的写操作。同第一类问题不同,在一个写者后到达的读者必须等待,即使这个写者也是在等待。
12.5.5基于预线程的并发服务器
一个基于预线程化的服务器通过使用如下图所示的生产者——消费者模型来降低这种开销。
- 服务器是由一个主线程和一组工作组线程构成的。
- 主线程不断地接受来自客户端的连接请求,并将得到的连接描述符放在一个有限缓冲区中。
- 每一个工作组线程反复地从共享缓冲区中取出描述符,为客户端服务,然后等待下一个描述符。
12.7 其他并发问题
四种不安全函数;
(1)可重入函数。可重入函数是线程安全函数的一个真子集,它不访问任何共享数据。可重入安全函数通常比不可重入函数更有效,因为它们不需要任何同步原语。
(2)竞争。当程序员错误地假设逻辑流该如何调度时,就会发生竞争。为了消除竞争,通常我们会动态地分配内存空间。
(3)死锁。当一个流等待一个永远不会发生的事件时,就会发生死锁。
总结:
一个并发进程是由在时间上重叠的一组逻辑流组成的。本章我们学习了三种不同的构建并发程序的机制:进程、I/O多路重复和线程。
进程是由内核自动调度的,而且因为他们有各自独立的虚拟地址空间,所以要实现共享数据,必须要有显式的IPC机制。
无论哪种并发机制,同步对共享数据的并发访问都是一个困难的问题。提出对信号量的P和V操作就是为了帮助解决这个问题。
并发也引入了其他一些困难的问题。被线程调用的函数必须具有一种称为线程安全的属性。