Linux文件IO操作函数概述

文件概述

Linux中,一切皆文件。文件为操作系统服务和设备提供了一个简单而一致的接口。这意味着程序完全可以像使用文件那样使用磁盘文件、串行口、打印机和其他设备。

也就是说,大多数情况下,你只需要使用5个函数: open、close、read、write和ioctl。 例外的情况: 目录的读写,网络连接等特殊文件

 

目录

文件通常由两部分组成: 内容 + 属性,即管理信息,包括文件的创建修改日期和访问权限等。属性均保存在 inode 节点中。inode - "索引节点",储存文件的元信息,比如

文件的创建者、文件的创建日期、文件的长度和文件在磁盘上存放的位置等等。每个inode都有一个号码,操作系统用inode号码来识别不同的文件。ls -i  查看inode 号。

 目录是用于保存其他文件的节点号和名字的文件,每个数据项为指向文件节点的链接。如下图:

当文件链接数变为零,意味文件删除,磁盘空间变成可用空间。

 

文件和设备

三个重要的设备文件:

/dev/console - 系统控制台。  

/dev/tty - 访问不同的物理设备。   

/dev/null - 空设备,向所有写这个设备的输出都将被丢弃。

 

设备驱动程序:

操作系统的核心部分,即内核,是由一组设备驱动程序组成。他们是一组对系统硬件进行控制的底层接口,为了向用户提供一个一致的接口,其封装了所有与硬件相关的特性。

硬件特有功能可通过ioctl(用于I/O控制)系统调用来提供。

 /dev 目录下的设备文件都可以被打开、读、写和关闭。

1)open : 打开文件或设备。

2)read : 从打开的文件或设备里读数据。

3)write: 向文件或设备写数据。

4)close: 关闭文件或设备。

5) ioctl:  把控制信息传递给设备驱动程序,每个驱动都由自己的一组 ioctl 命令。

 

 

库函数

针对输入输出操作直接使用底层系统调用效率非常低,原因由如下两点。

1)使用系统调用会影响系统性能。  

2)硬件会对底层系统调用一次所读写的数据块大小做限制。磁盘:至少一个扇区512

字节,磁带,一次 10K

 库函数给设备和磁盘文件提供了更高层的接口,即标准函数库。使用它你可以高效读写任意长度的数据块,库函数则在数据满足条件后再安排系统调用。这样极大降低了开销。

 注:库函数的文档一般放在手册的第三页,每个库函数有其对应的头文件。

 

底层文件访问

运行中的程序称为进程,每个进程都有与之关联的文件描述符。

 

文件描述符 - 一些小值整数,通过他们访问打开的文件或设备。开始运行会有三个文件描述符:

1)0:   标准输入   STDIN_FILENO

2)1:   标准输出   STDOUT_FILENO

3)2:   标准错误   STDERR_FILENO

 

文件描述符的变化范围是:0~OPEN_MAX-1 (可通过ulmit -a 查看)

 

write系统调用

作用:把缓冲区buf 的前count 个字节写入与文件描述符 fd 相关联的文件中。

#include <unistd.h>
size_t write(int fd,const void *buf, size_t count);

描述符出错,文件达到进程限制最大值或设备驱动程序对数据块 长度比较敏感,该返回值可能会小于count,这并不是一个错误。 0 表示未写入数据; -1 表示出错,错误代号在全局变量 errno里。

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <string.h>

int main()
{
      const char * output = "Hello World\n";
      const char * errstr = "A Write error has occurred on file descriptior !\n";
      if(write(1,output,strlen(output))!=strlen(output));
             write(2,errstr,strlen(errstr));
      exit(0);    
}     

 

read系统调用

作用:作用:从与文件描述符 fd 相关联的文件中读取前count 个字节到缓冲区buf 中。

#include <unistd.h>
size_t write(int fd,const void *buf, size_t count);

它返回实际读入的字节数,这可能会小于请求的字节数。 0 表示未读入任何数据,已到达了文件尾部。 -1 表示出错,错误代号在全局变量 errno里。

#include <unistd.h>
#include <stdlib.h>

int main()
{
     char buffer[128];
     int nread = read(0,buffer,128);
     if(nread == -1)
          write(2,"A read error has occurred\n",26);
      if(write(1,buffer,nread)!= nread)
          write(2,"A write error has occurred\n",27);
     
}

 

 

open系统调用

作用:创建一个新的文件描述符(文件或设备)。

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode);

open 建立一条到文件或设备的访问路径。成功后可获得供 read、write和其他系统调用使用的唯一的文件描述符。此文件描述符进程唯一;如果两个程序打开同一个文件,那么,他们分别得到不同的文件描述符,并可以单独对文件进行独立的操作。我们可以通过文件锁(O_EXCL或FCNTL)功能来解决这个问题。

参数说明:

pathname - 指示准备打开的文件或设备的名字;

flags    - 用于指定打开文件所采取的动作;

mode    - 用于指定创建文件的权限,O_CREATE 才使用。

flags 参数通过必需文件访问模式 与 其他可选模式相结合的方式来指定。 首先必须指定如下文件访问模式之一:

模     式

说    明

O_RDONLY

以只读方式打开

O_WRONLY

以只写方式打开

O_RDWR

以读写方式打开

可选模式组合:

1) O_APPEND: 把写入数据最佳在文件的末尾。

2) O_TRUNC:  打开文件时把文件长度设置为零,丢弃已有的内容。

3) O_CREAT:   如果需要,就按参数mode 中给出的访问模式创建文件。

4) O_EXCL:   与O_CREAT一起使用,确保创建文件的 原子操作。如果文件存在,创建 将失败

 

访问权限的初始:

单个权限设置     : S_I  R或W或X    USR或GRP或OTH

读写执行全权限 : S_I RWX             U或G或O

如: S_IRUSR    读权限  文件属性

   S_IRWXO   读写执行  其他用户 

最终权限生成还和进程设置的umask权限掩码有关,执行umask命令或者函数 可以改变权限。   

新文件描述符总使用未用文件描述符的最小值。如果一个文件符被关闭再次调用open ,其马上会被重用。

 !Posix 规定了一个 creat 调用:  等同于  O_CREAT|O_WRONLY|O_TRUNC 

 

close系统调用

作用:终止文件描述符fd 和对应文件(文件或设备)的关联。文件描述符被释放并能够重新使用。close 调用成功返回0,出错返回 -1。

#include <unistd.h>
int close(int fd);

返回值: 检查 close 调用的返回值很重要。可以检测某些写操作错误!

 

ioctl系统调用

ioctl提供了一个用于控制设备及其描述行为和配置底层的服务的接口。终端文件描述符、套接字都可以定义他们的ioctl,具体需要参考特定设备的手册。

#include <sys/ioctl.h>

int ioctl(int d, int request, ...);

 

 

dup和dup2的系统调用

作用:提供了一种复制文件描述符的方法,是我们通过两个或者更多不同的描述符来访问同一个文件,主要用于多个进程间进行管道通信。

#include <unistd.h>

       int dup(int oldfd);
       int dup2(int oldfd, int newfd);

 

lseek系统调用

作用:

作用:lseek 对文件描述符 fd 的读写指针进行设置。也就是说,设置文件的下一个读写位置。可根据绝对位置和相对位置(当前位置或文件尾部)进行设置。

#include <sys/types.h>
#include <unistd.h>

off_t lseek(int fd, off_t offset, int whence);

offset 参数用来指定位置,而whence 参数定义该偏移值的用法。Whence 可取值如下:

 

1)SEEK_SET:     offset 是一个绝对位置。

2)SEEK_CUR:    offset 是相对于当前位置的一个相对位置。

3)SEEK_END:    offset 是相对于文件尾的一个相对位置。

 lseek 返回从文件头到文件指针被设置处的字节偏移值,失败时返回-1.

 

fstat、stat和lstat系统调用

作用:获取文件的状态信息,该信息将会写入一个buf中,buf的地址会以参数的形式传递给fstat

#include <sys/types.h>
       #include <sys/stat.h>
       #include <unistd.h>

       int stat(const char *path, struct stat *buf);
       int fstat(int fd, struct stat *buf);
       int lstat(const char *path, struct stat *buf);

stat 和 lstat 均通过文件名查询状态信息,当文件名是符号链接时,lstat返回的时符号链接本身的信息,而stat 返回的时改链接指向的文件的信息。

struct stat {                                             
               dev_t     st_dev;     /* ID of device containing file */    
               ino_t     st_ino;     /* inode number */               
               mode_t    st_mode;    /* protection */                
               nlink_t   st_nlink;   /* number of hard links */           
               uid_t     st_uid;     /* user ID of owner */             
               gid_t     st_gid;     /* group ID of owner */            
               dev_t     st_rdev;    /* device ID (if special file) */    
               off_t     st_size;    /* total size, in bytes */           
               blksize_t st_blksize; /* blocksize for filesystem I/O */      
               blkcnt_t  st_blocks;  /* number of 512B blocks allocated */
               time_t    st_atime;   /* time of last access */           
               time_t    st_mtime;   /* time of last modification */     
               time_t    st_ctime;   /* time of last status change */     
           }; 

这里要特别提到的是,以上 st_mode 标志有一系列相关的宏,定义见 sys/stat.h 中

,可用来测试文件类型,如:

 

 

错误处理

许多系统调用和函数都会因为各种各样的原因失败。他们失败时设置外部变量errno 来知名失败原因。许多不同函数库都把这个变量用做报告错误的标准方法。

注意: 程序必须在函数报告出错 之后立刻检查errno 变量,因为它可能马上就被下一个函数调用所覆盖,即使下一个函数没有出错,也可能会覆盖这个变量。

常用错误代码的取值和含义如下:

l   EPERM:     操作不允许

l   ENOENT:   文件或目录不存在。

l   EINTR:     系统调用被中断。

l   EAGAIN:    重试,下次有可能成功!

l   EBADF:     文件描述符失效或本身无效

l   EIO:        I/O错误。

l   EBUSY:     设备或资源忙。

l   EEXIST:     文件存在。

l   EINVL:      无效参数。

l   EMFILE:     打开的文件过多。

l   ENODEV:    设备不存在。

l   EISDIR:      是一个目录。

l  ENOTDIR:     不是一个目录。

 

两个有效函数可报告出现的错误: strerror  和 perror。

 

strerror 函数

  作用:把错误代号映射成一个字符串,该字符串对发生的错误类型进行说明。

 

#include <string.h>                                                     
   char *strerror(int errnum);                                                
   int strerror_r(int errnum, char *buf, size_t buflen);

perror函数

  作用:perror 函数也把errno 变量中报告的当前错误映射成一个字符串,并把它输出到标准错误输出流。

 

perror(“test”);                                                            

结果:

Test: Too many open files     

 

 

 

 

 

 

         

posted @ 2018-06-26 13:52  小念之歌  阅读(9949)  评论(0编辑  收藏  举报