本文我们讲述一下Linux文件系统中的软链接与硬链接。

1. Linux的文件与目录

现代操作系统为解决信息能独立于进程之外被长期存储引入了文件,文件作为进程创建信息的逻辑单元可被多个进程并发使用。在Unix系统中,操作系统为磁盘上的文本与图像、鼠标与键盘等输入设备以及网络交互等IO操作设计了一组通用API,使它们被处理时均可统一使用字节流方式。换言之,Unix系统中除进程之外的一切皆是文件,而Linux保持了这一特性。为了便于文件的管理,Linux还引入了目录(有时亦被称为文件夹)这一概念。目录使文件可被分类管理,且目录的引入使Linux的文件系统形成一个层级结构的目录树。清单1所示的是普通Linux系统的顶层目录结构,其中/dev是存放了设备相关文件的目录。

清单1 Linux系统的顶层目录结构

/              根目录
├── bin     存放用户二进制文件
├── boot    存放内核引导配置文件
├── dev     存放设备文件
├── etc     存放系统配置文件
├── home    用户主目录
├── lib     动态共享库
├── lost+found  文件系统恢复时的恢复文件
├── media   可卸载存储介质挂载点
├── mnt     文件系统临时挂载点
├── opt     附加的应用程序包
├── proc    系统内存的映射目录,提供内核与进程信息
├── root    root 用户主目录
├── sbin    存放系统二进制文件
├── srv     存放服务相关数据
├── sys     sys 虚拟文件系统挂载点
├── tmp     存放临时文件
├── usr     存放用户应用程序
└── var     存放邮件、系统日志等变化文件

Linux与其他类Unix系统一样并不区分文件与目录:目录是记录了其他文件名的文件。使用命令mkdir创建目录时,若期望创建的目录的名称与现有的文件名(或目录名)重复,则会创建失败:

# ls -F /usr/bin/zi* 
/usr/bin/zip*       /usr/bin/zipgrep*  /usr/bin/zipnote* 
/usr/bin/zipcloak*  /usr/bin/zipinfo*  /usr/bin/zipsplit* 
 
# mkdir -p /usr/bin/zip 
mkdir: cannot create directory `/usr/bin/zip': File exists

Linux将设备当做文件进行处理,清单2展示了如何打开设备文件/dev/input/event5并读取文件内容。文件event5表示一种输入设备,其可能是鼠标或键盘等。查看文件/proc/bus/input/devices可知event5对应的设备类型。设备文件/dev/input/event5使用read()以字节流的方式被读取。结构体input_event被定义在内核头文件linux/input.h中:

清单2 打开并读取设备文件

int fd; 
struct input_event ie; 
fd = open("/dev/input/event5", O_RDONLY); 
read(fd, &ie, sizeof(struct input_event)); 
printf("type = %d  code = %d  value = %d\n", 
            ie.type, ie.code, ie.value); 
close(fd);

2. 硬链接与软连接的联系与区别

我们知道文件都有文件名与数据,这在Linux上被分成两个部分:用户数据(user data)与元数据(metadata)。用户数据,即文件数据块(data block),数据块是记录文件真实内容的地方; 而元数据则是文件的附加属性,如文件大小、创建时间、所有者等信息。在Linux中,元数据中的inode号(inode是文件元数据的一部分,但其并不包含文件名,inode号即索引节点号)才是文件的唯一标识而非文件名。文件名仅是为了方便人们的记忆和使用,系统或程序通过inode号寻找正确的文件数据块。下图展示了程序通过文件名获取文件内容的过程:

图1 通过文件名打开文件

linux-open-file

在Linux系统中查看inode号可使用命令statls -i(若是AIX系统,则使用命令istat)。清单3中使用命令mv移动并重命名文件glibc-2.16.0.tar.gz,其结果不影响文件的用户数据及inode号,文件移动前后inode号均为:2485677

清单3 移动或重命名文件

# stat /home/harris/source/glibc-2.16.0.tar.xz 
 File: `/home/harris/source/glibc-2.16.0.tar.xz'
 Size: 9990512      Blocks: 19520      IO Block: 4096   regular file 
Device: 807h/2055d      Inode: 2485677     Links: 1 
Access: (0600/-rw-------)  Uid: ( 1000/  harris)   Gid: ( 1000/  harris) 
... 
... 
# mv /home/harris/source/glibc-2.16.0.tar.xz /home/harris/Desktop/glibc.tar.xz 
# ls -i -F /home/harris/Desktop/glibc.tar.xz 
2485677 /home/harris/Desktop/glibc.tar.xz

为了解决文件的共享使用,Linux系统引入了两种链接: 硬链接(hard link)与软连接(又称符号链接,即soft link或symbolic link)。链接为Linux系统解决了文件的共享使用,还带来了隐藏文件路径、增加权限安全及节省存储等好处。若一个inode号对应多个文件名,则称这些文件为硬链接。换言之,硬链接就是同一个文件名使用了多个别名(它们有共同的inode)。硬链接可由命令linkln创建。如下是对文件oldfile创建硬链接:

# echo "hello,world" >> oldfile
# link oldfile newfile
# ln oldfile newfile2
# ln newfile newfile3
# ls
newfile  newfile2  newfile3  oldfile

# stat oldfile
  File: ‘oldfile’
  Size: 12              Blocks: 8          IO Block: 4096   regular file
Device: 803h/2051d      Inode: 1781007     Links: 4
Access: (0644/-rw-r--r--)  Uid: (    0/    root)   Gid: (    0/    root)
Access: 2019-07-14 20:08:50.497883532 -0700
Modify: 2019-07-14 20:08:50.497883532 -0700
Change: 2019-07-14 20:09:42.059085881 -0700
 Birth: -
# stat  newfile
  File: ‘newfile’
  Size: 12              Blocks: 8          IO Block: 4096   regular file
Device: 803h/2051d      Inode: 1781007     Links: 4
Access: (0644/-rw-r--r--)  Uid: (    0/    root)   Gid: (    0/    root)
Access: 2019-07-14 20:08:50.497883532 -0700
Modify: 2019-07-14 20:08:50.497883532 -0700
Change: 2019-07-14 20:09:42.059085881 -0700
 Birth: -

# ls -i 
1781007 newfile  1781007 newfile2  1781007 newfile3  1781007 oldfile

从上面可以看到,这四个文件都具有相同的inode号。

2.1 硬链接特性

由于硬链接是有着相同inode号仅文件名不同的文件,因此硬链接存在以下几个特点:

  • 文件有相同的inode以及data block

  • 只能对已存在的文件进行创建

  • 不能交叉文件系统进行硬链接的创建

  • 不能对目录进行创建,只可对文件创建

  • 删除一个硬链接文件并不影响其他有相同inode号的文件

请单4 硬链接特性展示

# ls -li 
total 0 
 
// 只能对已存在的文件创建硬连接
# link old.file hard.link 
link: cannot create link `hard.link' to `old.file': No such file or directory 
 
# echo "This is an original file" > old.file 
# cat old.file 
This is an original file 
# stat old.file 
 File: `old.file'
 Size: 25           Blocks: 8          IO Block: 4096   regular file 
Device: 807h/2055d      Inode: 660650      Links: 2 
Access: (0644/-rw-r--r--)  Uid: (    0/    root)   Gid: (    0/    root) 
... 

// 文件有相同的 inode 号以及 data block 
# link old.file hard.link | ls -li 
total 8 
660650 -rw-r--r-- 2 root root 25 Sep  1 17:44 hard.link 
660650 -rw-r--r-- 2 root root 25 Sep  1 17:44 old.file 
 
// 不能交叉文件系统
# ln /dev/input/event5 /root/bfile.txt 
ln: failed to create hard link `/root/bfile.txt' => `/dev/input/event5': 
Invalid cross-device link 
 
// 不能对目录进行创建硬连接
# mkdir -p old.dir/test 
# ln old.dir/ hardlink.dir 
ln: `old.dir/': hard link not allowed for directory 

# ls -iF 
660650 hard.link  657948 old.dir/  660650 old.file

文件old.filehard.link有着相同的inode号: 660650及文件权限, inode是随着文件的存在而存在,因此只有当文件存在时才可创建硬链接,即当inode存在且链接计数器(link count)不为0时。inode号仅在各文件系统下是唯一的,当Linux挂载多个文件系统后将出现inode号重复的现象(如清单5所示,文件t3.jpgsync以及123.txt并无关联,却有着相同的inode号),因此硬链接创建时不可跨越文件系统。设备文件目录/dev使用的文件系统是devtmpfs,而/root(与根目录/一致)使用的是磁盘文件系统ext4清单5展示了使用命令df查看当前系统中挂载的文件系统类型、各文件系统inode使用情况以及文件系统挂载点。

清单5 查找有相同inode号的文件

# df -i --print-type 
Filesystem     Type       Inodes  IUsed    IFree IUse% Mounted on 
/dev/sda7      ext4      3147760 283483  2864277   10% / 
udev           devtmpfs   496088    553   495535    1% /dev 
tmpfs          tmpfs      499006    491   498515    1% /run 
none           tmpfs      499006      3   499003    1% /run/lock 
none           tmpfs      499006     15   498991    1% /run/shm 
/dev/sda6      fuseblk  74383900   4786 74379114    1% /media/DiskE 
/dev/sda8      fuseblk  29524592  19939 29504653    1% /media/DiskF 
 
# find / -inum 1114 
/media/DiskE/Pictures/t3.jpg 
/media/DiskF/123.txt 
/bin/sync

值得一提的是,Linux系统存在inode号被用完但磁盘空间还有剩余的情况。我们创建一个5M大小的ext4类型的mo.img文件,并将其挂载至目录/mnt。然后我们使用一个shell脚本将挂载在/mnt下ext4文件系统的inode耗尽(见清单6)

清单6 测试文件系统 inode 耗尽但仍有磁盘空间的情景

# dd if=/dev/zero of=mo.img bs=5120k count=1 
1+0 records in
1+0 records out
5242880 bytes (5.2 MB) copied, 0.078982 s, 66.4 MB/s

# ls -lh mo.img
-rw-r--r-- 1 root root 5.0M Jul 15 00:43 mo.img
# mkfs -t ext4  -F ./mo.img
mke2fs 1.42.9 (28-Dec-2013)
Discarding device blocks: done                            
Filesystem label=
OS type: Linux
Block size=1024 (log=0)
Fragment size=1024 (log=0)
Stride=0 blocks, Stripe width=0 blocks
1280 inodes, 5120 blocks
256 blocks (5.00%) reserved for the super user
First data block=1
Maximum filesystem blocks=5242880
1 block group
8192 blocks per group, 8192 fragments per group
1280 inodes per group

Allocating group tables: done                            
Writing inode tables: done                            
Creating journal (1024 blocks): done
Writing superblocks and filesystem accounting information: done

# mount -o loop ./mo.img /mnt

# cat /mnt/inode_test.sh 
#!/bin/bash 
 
for ((i = 1; ; i++)) 
do 
   if [ $? -eq 0 ]; then 
       echo  "This is file_$i" > file_$i 
   else 
       exit 0 
   fi 
done 


# ./inode_test.sh 
./inode_test.sh: line 6: file_1269: No space left on device 
 
# df -iT /mnt/; du -sh /mnt/ 
Filesystem     Type Inodes IUsed IFree IUse% Mounted on 
/dev/loop0     ext4   1280  1280     0  100% /mnt 
1.3M    /mnt/

硬链接不能对目录创建是受限于文件系统的设计。现在Linux文件系统中的目录均隐藏了两个特殊的目录: 当前目录(.)与父目录(..)。查看这两个特殊目录的inode号可知其实这两目录就是两个硬链接(注意目录/mnt/lost+found/的inode号)。若系统允许对目录创建硬链接,则会产生目录环。

# ls -aliF /mnt/lost+found 
total 44 
11 drwx------ 2 root root 12288 Sep  1 17:54 ./ 
2 drwxr-xr-x 3 root root 31744 Sep  1 17:57 ../ 
 
# stat  /mnt/lost+found/ 
 File: `/mnt/lost+found/'
 Size: 12288        Blocks: 24         IO Block: 1024   directory 
Device: 700h/1792d      Inode: 11          Links: 2 
Access: (0700/drwx------)  Uid: (    0/    root)   Gid: (    0/    root) 
Access: 2012-09-01 17:57:17.000000000 +0800 
Modify: 2012-09-01 17:54:49.000000000 +0800 
Change: 2012-09-01 17:54:49.000000000 +0800 
Birth: -

2.2 软链接特性

软链接与硬链接不同,若文件用户数据块中存放的内容是另一文件的路径名的指向,则该文件就是软链接。软链接就是一个普通文件,只是数据块内容有点特殊。软链接有着自己的inode号以及用户数据块(见图2)。因此,软链接的创建与使用没有类似硬链接的诸多限制:

  • 软链接有自己的文件属性及权限等;

  • 可对不存在的文件或目录创建软链接;

  • 软链接可交叉文件系统;

  • 软链接可对文件或目录创建;

  • 创建软链接时,链接计数i_nlink不会增加;

  • 删除软链接并不影响被指向的文件,但若指向的原文件被删除,则相关软链接被称为死链接(即dangling link, 若被指向路径文件被重新创建,死链接可恢复为正常的软链接)

图2 软链接的访问

linux-softlink-visit

清单7 软链接特性展示

# ls -li 
 total 0 
 
 // 可对不存在的文件创建软链接
 # ln -s old.file soft.link 
 # ls -liF 
 total 0 
 789467 lrwxrwxrwx 1 root root 8 Sep  1 18:00 soft.link -> old.file 
 
 // 由于被指向的文件不存在,此时的软链接 soft.link 就是死链接
 # cat soft.link 
 cat: soft.link: No such file or directory 
 
 // 创建被指向的文件 old.file,soft.link 恢复成正常的软链接
 # echo "This is an original file_A" >> old.file 
 # cat soft.link 
 This is an original file_A 
 
 // 对不存在的目录创建软链接
 # ln -s old.dir soft.link.dir 
 # mkdir -p old.dir/test 
 # tree . -F --inodes 
 . 
├── [ 789497]  old.dir/ 
│   └── [ 789498]  test/ 
├── [ 789495]  old.file 
├── [ 789495]  soft.link -> old.file 
└── [ 789497]  soft.link.dir -> old.dir/

当然软链接的用户数据也可以是另一个软链接的路径,其解析过程是递归的。但需注意: 软链接创建时原文件的路径指向使用绝对路径较好。使用相对路径创建的软链接被移动后该软链接文件将成为一个死链(如下所示的软链接a使用了相对路径,因此不宜被移动),因为链接数据块中记录的亦是相对路径指向:

$ ls -li 
total 2136 
656627 lrwxrwxrwx 1 harris harris       8 Sep  1 14:37 a -> data.txt
656662 lrwxrwxrwx 1 harris harris       1 Sep  1 14:37 b -> a 
656228 -rw------- 1 harris harris 2186738 Sep  1 14:37 data.txt 6

3. 链接相关命令

在Linux中查看当前系统已挂着的文件系统类型,除上述使用的df命令外,还可以使用mount命令或查看文件/proc/mounts:

# mount 
/dev/sda7 on / type ext4 (rw,errors=remount-ro) 
proc on /proc type proc (rw,noexec,nosuid,nodev) 
sysfs on /sys type sysfs (rw,noexec,nosuid,nodev) 
... 
... 
none on /run/shm type tmpfs (rw,nosuid,nodev)

命令lsstat可以帮助我们区分软链接与其他文件并查看文件inode号,但较好的方式还是使用find命令,其不仅可以查找某文件的软链接,还可以用于查找相同inode的所有硬链接(见清单8)。

清单8 使用命令find查找软链接与硬链接

// 查找在路径 /home 下的文件 data.txt 的软链接
# find /home -lname data.txt 
/home/harris/debug/test2/a 
 
// 查看路径 /home 有相同 inode 的所有硬链接
# find /home -samefile /home/harris/debug/test3/old.file 
/home/harris/debug/test3/hard.link 
/home/harris/debug/test3/old.file 
 
# find /home -inum 660650 
/home/harris/debug/test3/hard.link 
/home/harris/debug/test3/old.file 
 
// 列出路径 /home/harris/debug/ 下的所有软链接文件
# find /home/harris/debug/ -type l -ls 
656662 0 lrwxrwxrwx 1 harris harris 1 Sep 1 14:37 /home/harris/debug/test2/b -> a
656627 0 lrwxrwxrwx 1 harris harris 8 Sep 1 14:37 /home/harris/debug/test2/a -> 
data.txt
789467 0 lrwxrwxrwx 1 root root 8 Sep 1 18:00 /home/harris/debug/test/soft.link -> 
old.file 
789496    0 lrwxrwxrwx   1 root     root            7 Sep  1 18:01 
/home/harris/debug/test/soft.link.dir -> old.dir

系统根据磁盘的大小默认设定了inode的值(见清单9),如有必要,可在格式化文件系统前对该值进行修改,如键入命令:

# mkfs -t ext4 -I 512 /dev/sda4

将使磁盘设备/dev/sda4格式化成inode大小是512字节的ext4文件系统。

清单9 查看系统的inode值

// 查看磁盘分区 /dev/sda7 上的 inode 值
# dumpe2fs -h /dev/sda7 | grep "Inode size"
dumpe2fs 1.42 (29-Nov-2011) 
Inode size:              256 
 
# tune2fs -l /dev/sda7 | grep "Inode size"
Inode size:              256

另外,我们可以通过df -i命令查看当前inode的使用情况:

# df -i /dev/sda2
Filesystem     Inodes IUsed  IFree IUse% Mounted on
devtmpfs       479526   396 479130    1% /dev

上面显示inode使用了约1%

4. Linux VFS

Linux有着极其丰富的文件系统,大体上可分为如下几类:

  • 网络文件系统, 如nfs、cifs等;

  • 磁盘文件系统,如ext4、ext3等;

  • 特殊文件系统,如proc、sysfs、ramfs、tmpfs等;

实现以上这些文件系统并在Linux下共存的基础就是Linux VFS(Virtual File System,又称Virtual Filesystem Switch),即虚拟文件系统。VFS作为一个通用的文件系统,抽象了文件系统的四个基本概念: 文件、目录项(dentry)、索引节点(inode)以及挂载点,其在Linux内核中为用户空间层的文件系统提供了相关的接口(见图3 所示VFS在Linux系统的架构)。VFS实现了open()、read()等系统调用,并使得cp等用户空间程序可跨文件系统。VFS真正实现了上述内容: 在Linux中除进程之外一切皆是文件。

图3 VFS在系统中的架构

linux-vfs-arch

Linux VFS存在四个基本对象: 超级块对象(superblock object)、索引节点对象(inode object)、目录项对象(dentry object)及文件对象(file object)。

  • 超级块对象代表一个已经安装的文件系统;

  • 索引节点对象代表一个文件;

  • 目录项对象代表一个目录项。如设备文件event5在/dev/input/event5中,其存在4个目录项对象: /dev/input/event5

  • 文件对象代表由进程打开的文件

这四个对象与进程及磁盘文件间的关系如图4所示,其中d_inode即为硬链接。为文件路径的快速解析,Linux VFS设计了目录项缓存(Directory Entry Cache,即dcache)

图4 VFS的对象之间的处理

linux-vfs-object

5. Linux文件系统中的inode

在Linux中,索引节点结构存在于系统内存及磁盘,其可区分成VFS inode与实际文件系统的inode。VFS inode作为实际文件系统中inode的抽象,定义了结构体inode与其相关的操作inode_operation(见内核源代码include/linux/fs.h).

清单10 VFS中inode与inode_operation

struct inode { 
   ... 
   const struct inode_operations   *i_op; // 索引节点操作
   unsigned long           i_ino;      // 索引节点号
   atomic_t                i_count;    // 引用计数器
   unsigned int            i_nlink;    // 硬链接数目
   ... 
} 
 
struct inode_operations { 
   ... 
   int (*create) (struct inode *,struct dentry *,int, struct nameidata *); 
   int (*link) (struct dentry *,struct inode *,struct dentry *); 
   int (*unlink) (struct inode *,struct dentry *); 
   int (*symlink) (struct inode *,struct dentry *,const char *); 
   int (*mkdir) (struct inode *,struct dentry *,int); 
   int (*rmdir) (struct inode *,struct dentry *); 
   ... 
}

清单10所见,每个文件存在两个计数器:i_count与i_nlink,即引用计数硬链接计数。结构体inode中的i_count用于跟踪当前文件被访问(引用)的数量,而i_nlink则是上述使用ls -i等命令查看到的文件硬链接数。或者说i_count跟踪文件在内存中的情况, 而i_nlink则是磁盘计数器。当文件被删除时,则i_nlink先被设置成0。文件的这两个计数器使得Linux系统升级或程序更新变得容易,系统或程序可以在不关闭的情况下(即文件i_count不为0),将新文件以同样的文件名进行替换,新文件有自己的inodedata block,旧文件会在相关进程关闭后被完整的删除。

清单11 文件系统ext4中的inode

struct ext4_inode { 
   ... 
   __le32  i_atime;        // 文件内容最后一次访问时间
   __le32  i_ctime;        // inode 修改时间
   __le32  i_mtime;        // 文件内容最后一次修改时间
   __le16  i_links_count;  // 硬链接计数
   __le32  i_blocks_lo;    // Block 计数
   __le32  i_block[EXT4_N_BLOCKS];  // 指向具体的 block 
   ... 
};

清单11 展示的是文件系统ext4中对inode的定义(见内核源码fs/ext4/ext4.h)。其中三个时间的定义可对应于命令stat中查看到三个时间。i_links_count不仅用于文件的硬链接计数,也用于目录的子目录数跟踪(目录并不显示硬链接数,命令ls -ld查看到的是子目录数)。由于文件系统ext4对i_links_count有限制,其最大数为:32000(该限制在ext4中被取消)。尝试在ext3文件系统上验证目录子目录及普通文件硬链接最大数可见

清单 11. 展示的是文件系统 ext4 中对 inode 的定义(见内核源码 fs/ext4/ext4.h)。其中三个时间的定义可对应与命令 stat 中查看到三个时间。i_links_count 不仅用于文件的硬链接计数,也用于目录的子目录数跟踪(目录并不显示硬链接数,命令 ls -ld 查看到的是子目录数)。



[参看]:

  1. 理解 Linux 的硬链接与软链接

  2. 硬链接和软链接的区别

  3. Linux ext4文件系统划分磁盘inode数量