硬链接和软链接

硬链接和软链接

实例

    程序打开一个文件,然后解除它的链接。执行该程序的进程然后睡眠30秒,接着就终止。
  1. #include"apue.h"
  2. #include<fcntl.h>
  3. int
  4. main(void)
  5. {
  6. if(open("tempfile", O_RDWR)<0)
  7. {
  8. err_sys("open error");
  9. }
  10. if(unlink("tempfile")<0)
  11. {
  12. err_sys("unlink error");
  13. }
  14. printf("file unlinked\n");
  15. sleep(30);
  16. printf("done\n");
  17. exit(0);
  18. }
    运行该程序,其结果如下:
$ ls -l tempfile
-rw-rw-r-- 1 fireway fireway 1344111767 10月 16 21:17 tempfile    <-----tempfile大小弄得大一些
$ df /home/
文件系统       1K-blocks     已用      可用 已用% 挂载点
/dev/sda1      151650468 29081848 114842132   21% /
$ ./unlink &
[1] 4456
$ file unlinked
ls -l tempfile
ls: 无法访问tempfile: 没有那个文件或目录
$ df /home
文件系统       1K-blocks     已用      可用 已用% 挂载点
/dev/sda1      151650468 29081848 114842132   21% /
$ done
df /home
文件系统       1K-blocks     已用      可用 已用% 挂载点
/dev/sda1      151650468 27769232 116154748   20% /
    进程用open或creat创建一个文件,然后再调用unlink,因为该文件仍旧是打开的,所以不会将其内容删除掉。
    只有当进程关闭该文件或者终止时,该文件的内容才被删除。

硬链接与软链接的联系与区别

    文件都有文件名与数据,在 Linux 上被分成两个部分:用户数据 (user data) 与元数据 (metadata)
    用户数据,即文件数据块 (data block),数据块是记录文件真实内容的地方
    元数据则是文件的附加属性,如文件类型、文件访问权限位、文件大小、创建时间、所有者、指向文件数据块的指针等信息
    在 Linux 中,元数据中的 inode 号(或称i节点号)才是文件的唯一标识而非文件名。文件名仅是为了方便人们的记忆和使用,系统或程序通过 inode 号寻找正确的文件数据块
    图 1.展示了程序通过文件名获取文件内容的过程。
图1. 通过文件名获取文件内容
    i-node是固定长度的记录项,它包含了有关文件的大部分信息。
 图2. 磁盘、分区和文件系统 
    在 Linux 系统中查看 inode 号可使用命令 stat 或 ls -i
$ stat chown_restricted.c 
  文件:"chown_restricted.c"
  大小:1625            块:8          IO 块:4096   普通文件
设备:801h/2049d        Inode:1707228     硬链接:1
权限:(0777/-rwxrwxrwx)  Uid:( 1000/ fireway)   Gid:( 1000/ fireway)
最近访问:2016-10-23 15:48:00.106111057 +0800
最近更改:2016-10-23 15:47:56.638093860 +0800
最近改动:2016-10-23 15:47:56.686094098 +0800
创建时间:-
$ mv chown_restricted.c mychown_restricted.c
$ stat mychown_restricted.c
  文件:"mychown_restricted.c"
  大小:1625            块:8          IO 块:4096   普通文件
设备:801h/2049d        Inode:1707228     硬链接:1
权限:(0777/-rwxrwxrwx)  Uid:( 1000/ fireway)   Gid:( 1000/ fireway)
最近访问:2016-10-23 15:48:00.106111057 +0800
最近更改:2016-10-23 15:47:56.638093860 +0800
最近改动:2016-10-23 16:39:02.469296496 +0800
创建时间:-
    使用命令 mv 移动并重命名文件,其结果不影响文件的用户数据及inode号。下文会有详细原因。
    为解决文件的共享使用,Linux 系统引入了两种链接:硬链接 (hard link) 与软链接(又称符号链接,symbolic link)
    链接为 Linux 系统解决了文件的共享使用,还带来了隐藏文件路径、增加权限安全及节省存储等好处

硬链接

    若一个 inode 号对应多个文件名,则称这些文件为硬链接。换言之,硬链接就是同一个文件使用了多个别名。
    硬链接可由命令 link ln 创建。如下是对文件 oldfile 创建硬链接。
link oldfile newfile 
ln oldfile newfile
    由于硬链接是有着相同 inode 号仅文件名不同的文件,因此硬链接存在以下几点特性:
  1. 文件有相同的 inode 及 data block;
  2. 只能对已存在的文件进行创建;
  3. 不能交叉文件系统进行硬链接的创建;
  4. 不能对目录进行创建,只可对文件创建;
  5. 删除一个硬链接文件并不影响其他有相同 inode 号的文件。
$ ls -li
总用量 0
$ link old.file hard.link    <------------------- 只能对已存在的文件创建硬连接
link: 无法创建指向"old.file" 的链接"hard.link": 没有那个文件或目录
$ echo "This is an original file" > old.file 
$ stat old.file 
  文件:"old.file"
  大小:25              块:8          IO 块:4096   普通文件
设备:801h/2049d        Inode:2371939     硬链接:1
权限:(0664/-rw-rw-r--)  Uid:( 1000/ fireway)   Gid:( 1000/ fireway)
最近访问:2016-10-23 16:52:51.873409289 +0800
最近更改:2016-10-23 16:52:51.873409289 +0800
最近改动:2016-10-23 16:52:51.873409289 +0800
创建时间:-
$ link old.file hard.link | ls -li    <---------- 文件有相同的 inode 号以及 data block 
总用量 8
2371939 -rw-rw-r-- 2 fireway fireway 25 10月 23 16:52 hard.link
2371939 -rw-rw-r-- 2 fireway fireway 25 10月 23 16:52 old.file
    文件 old.file 与 hard.link 有着相同的 inode 号:2371939 及文件权限,inode 是随着文件的存在而存在,因此只有当文件存在时才可创建硬链接。
$ ln /dev/input/event5 mylink   <---------- 不能交叉文件系统
ln: 无法创建硬链接"mylink" => "/dev/input/event5": 无效的跨设备连接
$ ln temp/ mylink    <--------------- 不能对目录进行创建硬连接
ln: "temp/": 不允许将硬链接指向目录
    inode 是随着文件的存在而存在,因此只有当文件存在时才可创建硬链接
    在stat结构中,链接计数包含在st_nlink成员中,其基本的系统数据类型是nlink_t
  1. struct stat
  2. {
  3. mode_t st_mode;/* file type & mode (permissions) */
  4. ino_t st_ino;/* i-node number (serial number) */
  5. dev_t st_dev;/* device number (file system) */
  6. dev_t st_rdev;/* device number for special files */
  7. nlink_t st_nlink;/* number of links */
  8. uid_t st_uid;/* user ID of owner */
  9. gid_t st_gid;/* group ID of owner */
  10. off_t st_size;/* size in bytes, for regular files */
  11. struct timespec st_atim;/* time of last access */
  12. struct timespec st_mtim;/* time of last modification */
  13. struct timespec st_ctim;/* time of last file status change */
  14. blksize_t st_blksize;/* best I/O block size */
  15. blkcnt_t st_blocks;/* number of disk blocks allocated */
  16. };
    当 inode 存在且链接计数器(link count)不为 0 时。inode 号仅在各文件系统下是唯一的,当 Linux 挂载多个文件系统后将出现 inode 号重复的现象,因为目录项中的i节点编号指向同一文件系统中的相应的i节点,一个目录项不能指向另一个文件系统的i节点。这就是为什么ln(1)命令不能跨越文件系统的原因。
    只有当链接计数减少至0时,才可删除该文件(也就是可以释放该文件占用的数据块),这也是为什么删除一个目录项的函数被称之为unlink而不是delete的原因。
    当在不更换文件系统时,为一个文件重命名mv(1)时,该文件的实际内容并未移动,只需要构造一个指向现有i节点的新目录项,并删除老的目录项。链接数不会改变。
    POSIX.1常量LINK_MAX指定了一个文件连接数的最大值。
    stat结构中的大多数信息都取自i节点。只有两项重要数据存放在目录项中:文件名和i节点编号,其他的数据项并不是我们本篇内容关心的。i节点编号的数据类型是ino_t
    以一个目录文件的链接计数为例子,假定我们在工作目录中构造了一个目录
$ mkdir testdir
    1) 编号为2549的i节点,其类型字段表示它是一个目录,链接计数为2。
    2) 编号为1267的i节点,其类型字段表示它是一个目录,链接数大于或等于3。
 
 
图3. 创建了目录testdir后的文件系统实例
 

软链接

    若文件用户数据块中存放的内容是另一文件的路径名的指向,则该文件就是软连接(也叫符号链接 symbolic link)
    软链接就是一个普通文件,只是数据块内容有点特殊。
    软链接有着自己的 inode 号以及用户数据块。
    软 链接一般用于将一个文件或整个目录结构移到系统中另一个位置
    软链接有如下的特性:
  1. 软链接有自己的文件属性及权限等;
  2. 可对不存在的文件或目录创建软链接;
  3. 软链接可交叉文件系统;
  4. 软链接可对文件或目录创建;
  5. 创建软链接时,链接计数 link count 不会增加;
  6. 删除软链接并不影响被指向的文件,但若被指向的原文件被删除,则相关软连接被称为死链接(即 dangling link,若被指向路径文件被重新创建,死链接可恢复为正常的软链接)。
$ ls -li
总用量 0
$ ln -s old.file soft.link 
$ ls -liF 
总用量 0
2371941 lrwxrwxrwx 1 fireway fireway 8 10月 23 17:13 soft.link -> old.file
$ cat soft.link   <-------- 由于被指向的文件不存在,此时的软链接 soft.link 就是死链接
cat: soft.link: 没有那个文件或目录
$ echo "This is an original file_A" >> old.file 
$ cat soft.link 
This is an original file_A
$ ln -s old.dir soft.link.dir   <-------------------- 对不存在的目录创建软链接
$ ll
总用量 8
drwxrwxr-x  2 fireway fireway 4096 10月 23 17:18 ./
drwxr-xr-x 16 fireway fireway 4096 10月 23 17:18 ../
lrwxrwxrwx  1 fireway fireway    7 10月 23 17:18 soft.link.dir -> old.dir
$ tree . -F --inodes 
.
├── [2371945]  old.dir/
│   └── [2371946]  test/
└── [2371945]  soft.link.dir -> old.dir/
3 directories, 0 files
    当使用以名字引用文件的函数时,应当了解该函数是否处理软链接。如若该函数具有处理软链接的功能,则其路径名参数引用由软链接指向的文件。否则,一个路径名参数引用软链接本身。
函数 不跟随符号链接 跟随符号链接
access  
chdir  
chmod  
chown  
creat  
exec  
lchown  
link  
lstat  
open  
opendir  
pathconf  
readlink  
remove  
rename  
stat  
truncate  
unlink  
表1 各个函数对符号链接的处理
    上面的表中有一个例外,同时用O_CREAT和O_EXCL两者调用open函数。在此情况下,若路径名是软链接,open将出错返回,errno设置为EEXIST。这种处理方式的意图是堵塞一个安全性漏洞,以防止具有特权的进程被诱骗写错误的文件。
    用open打开文件时,如果传递给open函数的路径名指定一个符号链接,那么open跟随此链接到达所指定的文件。若此符号链接所指向的文件并不存在,则open返回出错,表示它不能打开该文件。这可能会是不熟悉符号链接的用户感到迷惑。

链接相关命令

    在 Linux 中查看当前系统已挂着的文件系统类型,除上述使用的命令 df,还可使用命令 mount 或查看文件 /proc/mounts。
$ mount
/dev/sda1 on / type ext4 (rw,errors=remount-ro)
proc on /proc type proc (rw,noexec,nosuid,nodev)
sysfs on /sys type sysfs (rw,noexec,nosuid,nodev)
.......
.......
gvfsd-fuse on /run/user/112/gvfs type fuse.gvfsd-fuse (rw,nosuid,nodev,user=lightdm)
    命令 ls stat 可帮助我们区分软链接与其他文件并查看文件 inode 号,但较好的方式还是使用 find 命令,其不仅可查找某文件的软链接,还可以用于查找相同 inode 的所有硬链接
$ find ~ -lname old.file     <------------- 查找在路径~下的文件old.file的软链接                          
/home/fireway/study/temp2/soft.link
$ find ~ -samefile ~/study/temp/old.file    <-----------  查看路径~有相同inode的所有硬链接
/home/fireway/study/temp/old.file
/home/fireway/study/temp/hard.link
$ find /home -inum 2371939 
/home/fireway/study/temp/old.file
/home/fireway/study/temp/hard.link
$ find /home/fireway/study/temp2 -type l -ls    <---- 列出路径/home/fireway/study/temp2下的所有软链接文件
2371941    0 lrwxrwxrwx   1 fireway  fireway         8 10月 23 17:13 /home/fireway/study/temp2/soft.link -> old.file

Linux VFS

    Linux 有着极其丰富的文件系统,大体上可分如下几类:
  1. 网络文件系统,如 nfs、cifs 等;
  2. 磁盘文件系统,如 ext4、ext3 等;
  3. 特殊文件系统,如 proc、sysfs、ramfs、tmpfs 等。
    实现以上这些文件系统并在 Linux 下共存的基础就是Linux VFS(Virtual File System)
    VFS 作为一个通用的文件系统,抽象了文件系统的四个基本概念:文件、目录项 (dentry)、索引节点 (inode) 及挂载点,其在内核中为用户空间层的文件系统提供了相关的接口,如图4
图 4. VFS 在系统中的架构
    VFS 实现了 open()、read() 等系统调并使得 cp 等用户空间程序可跨文件系统。VFS 真正实现了上述内容中:在 Linux 中除进程之外一切皆是文件
    VFS 存在四个基本对象:超级块对象 (superblock object)、索引节点对象 (inode object)、目录项对象 (directory entry object, 或dentry boject) 及文件对象 (file object)。
  1. 超级块对象代表一个已安装的文件系统;
  2. 索引节点对象代表一个文件;
  3. 目录项对象代表一个目录项,如设备文件 event5 在路径 /dev/input/event5 中,其存在四个目录项对象:/ 、dev/ 、input/ 及 event5。
  4. 文件对象代表由进程打开的文件。
    这四个对象与进程及磁盘文件间的关系如图3.所示,其中 d_inode 即为硬链接。为文件路径的快速解析,Linux VFS 设计了目录项缓存(Directory Entry Cache,即 dcache)。
 图5. VFS 的对象之间的处理
 

函数link、linkat、unlink、unlinkat和remove用法

    创建一个指向现有文件的链接的方法是使用link函数或linkat函数。
#include <unistd.h>

int link(const char *existingpath, const char *newpath);

int linkat(int efd, const char *existingpath, int nfd, const char *newpath, int flag);

Both return: 0 if OK, −1 on error
    这两个函数创建一个新目录项newpath,它引用现有文件existingpath。如果newpath已经存在,则返回出错。
    对于linkat函数,我们需要注意几点:
  1. 现有文件是通过efdexistingpath参数指定的,新的路径名是通过nfdnewpath参数指定的。
  2. 默认情况下,如果两个路径名中的任一个是相对路径,那么它需要通过相对于相应的文件描述符进行计算。
  3. 如果两个文件描述符中的任一个设置了AT_FDCWD,那么相应的路径名就通过相对于当前目录进行计算。
  4. 如果任一路径名是绝对路径,相应的文件描述符参数就会被忽略。
    当现有文件是符号链接时,由flag参数决定linkat函数是创建指向现有符号链接的链接还是创建指向现有符号链接所指向的文件的链接。
  • flag设置了AT_SYMLINK_FOLLOW标志,就创建指向符号链接目标的链接。
  • flag没有设置这个标志,则创建一个指向符号链接本身的链接。 
    为了删除一个现有的目录项,可以调用unlink函数。
#include <unistd.h>

int unlink(const char *pathname);

int unlinkat(int fd, const char *pathname, int flag);

Both return: 0 if OK, −1 on error
    这两个函数删除目录项,并将由pathname所引用文件的链接计数减1。
    如果对该文件还有其他的链接,则仍可通过其他的链接访问该文件的数据。
    如果出错,则不对该文件做任何更改。
    如果pathname是符号链接,那么unlink删除该符号链接,而不是删除由该链接所引用的文件。给出符号链接名的情况下,没有一个函数能删除由该链接所引用的文件。
    如果文件系统支持的话,超级用户可以调用unlink,其参数pathname指定一个目录。但是通常应当使用rmdir函数。
    我们也可以使用remove函数解除对一个文件或目录的链接。对于文件,remove的功能与unlink相同。对于目录,remove的功能与rmdir相同。
#include <stdio.h>

int remove(const char *pathname);

Returns: 0 if OK, −1 on error

创建和读取软链接

     可以使用symlink或者symlinkat函数创建一个符号链接。
#include <unistd.h>

int symlink(const char *actualpath, const char *sympath);

int symlinkat(const char *actualpath, int fd, const char *sympath);

Both return: 0 if OK, −1 on error
    函数创建了一个指向了actualpath的新目录项sympath
    symlinkat函数跟symlink函数类似,但sympath参数根据相对于打开文件描述符fd引用的目录进行计算。如果sympath参数指定的是绝对路径或者fd参数设置了AT_FDCWD值,那么symlinkat就等同于symlink函数。
    要打开软链接本身,并读取链接中的名字,使用readlinkreadlinkat函数,而open函数会跟随软链接。
#include <unistd.h>

ssize_t readlink(const char* restrict pathname, char *restrict buf, size_t bufsize);

ssize_t readlinkat(int fd, const char* restrict pathname, char *restrict buf, size_t bufsize);

Both return: number of bytes read if OK, −1 on error
    两个函数组合了openreadclose的所有操作。如果函数成功执行,则返回读入buf的字节数。在buf中返回的软链接的内容不以null字节终止。
    当pathname参数指定的是绝对路径或者fd参数设置AT_FDCWD,readlinkat函数和readlink相同。
    当fd参数是一个打开目录的有效文件描述符并且pathname参数是相对路径,则readlinkat函数计算相对于由fd代表的打开目录的路径名。

参考

UNIX环境高级编程(第三版)- 4.14 文件系统
UNIX环境高级编程(第三版)- 4.15 函数link、linkat、unlink、unlinkat和remove
UNIX环境高级编程(第三版)- 4.17 符号链接
UNIX环境高级编程(第三版)- 4.18 创建和读取符号链接
posted @ 2016-10-23 18:31  fireway  阅读(6404)  评论(0编辑  收藏  举报