Unix System Overview
一.Unix 体系结构
由上图可以看出,内核居于最里层,Shell,Libary routines,以及Application通过系统调用(system calls)访问内核提供的功能。注意系统调用与函数调用的关系,两者不是一个东西。应用程序可以通过Shell和库访问内核功能,也可以直接通过系统调用访问内核。
二.登录
1.登录
我们使用用户名和密码登录Unix系统,系统会在/etc/passwd文件中校验我们的用户名,在/etc/shadow中校验密码。/etc/passwd文件内容格式如下:
root:x:0:0:root:/root:/bin/bash
其中各项用:隔开,分别代表:用户名,密码保存位置,UserID,GroupID,注释,家目录,使用的shell.
/etc/shadow文件内容格式如下:
root:x:16097:0:99999:7::::
各项用:分开,分别代表:用户名,加密密码,上次更改密码的时间,最短密码期限等
2.shell
使用的shell 由登录文件的最后一项决定,一般是/bin/bash,常见的shell除了bash ,还有C Shell,B shell,K shell,T Shell
三.文件和目录
1.文件系统
Unix系统文件结构由目录与文件构成的树构成,/为根目录。目录是包含目录项的文件,目录项是由包含文件名以及描述文件属性的结构组成。文件属性一般有文件的所有者,文件的访问权限,文件的大小,存储位置等。
2.文件名
文件名由字母,_,数字组成,/和NULL不可出现在文件名中。.与..在创建任何目录的时候自动创建,分别代表当前目录以及父目录。
3.路径名
由/开始并由/分隔开来的多个文件名组成的字符串称为路径名,比如/root/test,路径分为绝对路径和相对路径。绝对路径指从根目录/出发一直到访问目的目录,否则即为相对路径。
下面的代码实现一个简单的ls
<span style="font-size:18px;"><span style="font-size:18px;">/************************************************************************* > File Name: ls.c > Author: CodingPeasant > Mail: 1612853779@qq.com > Created Time: Mon 11 Aug 2014 06:10:09 AM PDT ************************************************************************/ #include<stdio.h> #include <stdlib.h> #include <dirent.h> int main(int argc,char * argv[]) { DIR* dp; struct dirent *dirp; if(argc != 2) { printf("usage:myls directory_name"); exit(-1); } if( (dp = opendir(argv[1])) == NULL ) { printf("can not open %s",argv[1]); exit(-1); } while((dirp = readdir(dp)) != NULL) { printf("%s\n",dirp->d_name); } closedir(dp); return 0; } </span></span>
3.工作目录
工作目录也叫当前工作目录,是进程的一个属性,进程可以使用chdir系统调用更改自己的工作目录。
4.家目录
我们登录后的第一个目录就是当前用户的家目录,家目录由登录文件/etc/passwd最后一项决定。
四.输入与输出
1.文件描述符:内核用于标记被进程访问的文件的的小正整数,由open()或者create()返回,用于其他文件访问的参数。
2.Shell在执行新程序的时候,打开标准输入,标准输出,标准出错输出,默认三者都指向终端文件。
3.非缓冲IO:所有IO操作都在内核空间中完成,open,read,write,seek,close是基本操作,这几个系统调用都和文件描述符(file descibe)相关联。
下面是一个拷贝到小程序:
<span style="font-size:18px;">/************************************************************************* > File Name: cp.c > Author: CodingPeasant > Mail: 1612853779@qq.com > Created Time: Tue 12 Aug 2014 06:27:16 AM PDT ************************************************************************/ #include<stdio.h> #include<unistd.h> #include<stdlib.h> #define BUFFSIZE 4096 int main() { int n; char buf[BUFFSIZE]; while( ( n = read(STDIN_FILENO,buf,BUFFSIZE)) > 0 ) { if(write(STDOUT_FILENO,buf,n)!= n) { printf("write error"); exit(-1); } } if (n < 0) { printf("read error"); exit(-1); } exit(0); } </span>
假设生成的文件为mycp,则执行mycp < input_file,输入为input_file,输出为终端,出错输出也为终端。
执行mycp <input_file >out_file 则复制input_file内容到out_file。
4.标准IO:提供带有缓冲机制的IO访问函数,不需要自己管理缓冲区大小。
五.进程
1.程序和进程:程序指存在磁盘上的可执行文件,是静态的行为。当程序被内核以exec函数执行的时候,就变成了进程,进程是动态行为。
2.进程ID:每个进程都有一个非负数标识,叫做进程ID。
下面的小程序获取进程ID:
<span style="font-size:18px;">/************************************************************************* > File Name: pid.c > Author: CodingPeasant > Mail: 1612853779@qq.com > Created Time: Tue 12 Aug 2014 06:59:38 AM PDT ************************************************************************/ #include<stdio.h> #include<unistd.h> #include<sys/types.h> int main() { pid_t pid; printf("current process id:%ld\n",(long)getpid()); return 0; } </span>
3.进程管理:fork创建子进程,exec函数族执行新程序,waitpid,wait进行子进程善后处理。下面是一个简易版shell:
<span style="font-size:18px;">/************************************************************************* > File Name: shell.c > Author: CodingPeasant > Mail: 1612853779@qq.com > Created Time: Tue 12 Aug 2014 07:12:58 AM PDT ************************************************************************/ #include<stdio.h> #include<stdlib.h> #include<string.h> #include<sys/wait.h> #include<unistd.h> #define MAXLINE 100 int main(int argc,char* argv[]) { char buf[MAXLINE]; pid_t pid; int status; printf("%%"); while(fgets(buf,MAXLINE,stdin)!= NULL) { if(buf[strlen(buf)-1] == '\n') { buf[strlen(buf)-1] = 0; /*replace \n to NULL*/ } if((pid = fork()) < 0) { printf("fork error\n"); exit(-1); }else if(pid == 0)//child process { execlp(buf,buf,(char*)0);//exec new progromme printf("can not execute :%s",buf); exit(127); } //parent if((pid = waitpid(pid,&status,0)) < 0) { printf("waitpid error"); exit(-1); } printf("%%"); } } </span>
关于程序的几点说明:
1.因为exec函数最后一个参数需要(char*)0,所以将读入的字符串的newline符号改为NULL
2.execlp第一个参数为文件名,系统会在环境变量中查找该文件,如果文件不是可执行文件,尝试用shell执行之。如果文件没找到报错
3.waitpid进行子进程资源回收以及执行状态获取。
线程:是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。进程中的所有线程共享进程的地址空间,文件描述符,栈以及其他进程属性。
线程ID:用于唯一标识一个线程,只在同一个进程中有意义。
六.错误处理
1.在Unix中一般函数调用出错返回值小于0,并且设置errno,用了表示发生了什么错误。
2.<errno.h> 定义了错误号的宏
3.通过char* strerror(int errnum);可以返回errnum对应的字符串标识
4.通过void perror(const char* msg);打印提示信息msg:error message
七.用户标识
1.User ID:由root分配用于系统唯一标识一个用户的数字,我们不可以改变。系统使用UserID测试我们是否可以访问相关资源。
2.Group ID:由root分配用于系统唯一标识一个组的数字。
3.附加组ID(Supplementary Group IDs):一个用户可以属于其他 组,用附加组ID表示这些组。
获取UserID 和 Group ID的小程序:
<span style="font-size:18px;">#include <sys/types.h> #include <unistd.h> #include <stdio.h> int main() { printf("uid:%d,gid:%d",getuid(),getgid()); exit(0); }</span>
八.信号
1.信号:用来通知进程某些条件发生的一种机制
2.对信号的处理方式:(1)忽略信号 (2)按照默认行为处理 (2)设置信号处理函数
3.增加了信号处理的简单shell:
<span style="font-size:18px;">/************************************************************************* > File Name: shell.c > Author: CodingPeasant > Mail: 1612853779@qq.com > Created Time: Tue 12 Aug 2014 07:12:58 AM PDT ************************************************************************/ #include<stdio.h> #include<stdlib.h> #include<string.h> #include<sys/wait.h> #include<unistd.h> #include<signal.h> #define MAXLINE 100 //deal with intrupt signal static void sig_int(int); int main(int argc,char* argv[]) { char buf[MAXLINE]; pid_t pid; int status; if(signal(SIGINT,sig_int) == SIG_ERR) { printf("signal error"); return -1; } printf("%%"); while(fgets(buf,MAXLINE,stdin)!= NULL) { if(buf[strlen(buf)-1] == '\n') { buf[strlen(buf)-1] = 0; /*replace \n to NULL*/ } if((pid = fork()) < 0) { printf("fork error\n"); exit(-1); }else if(pid == 0)//child process { execlp(buf,buf,(char*)0);//exec new progromme printf("can not execute :%s",buf); exit(127); } //parent if((pid = waitpid(pid,&status,0)) < 0) { printf("waitpid error"); exit(-1); } printf("%%"); } } void sig_int(int signo) { //just print signo printf("interrupt:%d\n",signo); } </span>
九.时间值
1.时间值分为:(1)日历时间,用time_t 结构表示,表示从1970 -1-1 00:00 到当前的秒数 (2)进程时间,用clock_t 结构标识,标识进程执行花了多少时钟
2.进程时间通常用三种值来衡量:(1)User CPU time :执行用户指令花费的时钟数(2)Sytem CPU time :执行系统指令花费的时钟数(3) clock time:进程执行花了多少时钟,受到其他进程的影响,通常指单一进程花费的时间
十.系统调用和库函数调用
1.进程执行分为用户态和内核态
2.系统调用和库函数调用区别:
函数库调用 |
系统调用 |
在所有的ANSI C编译器版本中,C库函数是相同的 |
各个操作系统的系统调用是不同的 |
它调用函数库中的一段程序(或函数) |
它调用系统内核的服务 |
与用户程序相联系 |
是操作系统的一个入口点 |
在用户地址空间执行 |
在内核地址空间执行 |
它的运行时间属于“用户时间” |
它的运行时间属于“系统”时间 |
属于过程调用,调用开销较小 |
需要在用户空间和内核上下文环境间切换,开销较大 |
在C函数库libc中有大约300个函数 |
在UNIX中大约有90个系统调用 |
典型的C函数库调用:system fprintf malloc |
典型的系统调用:chdir fork write brk; |