Linux中的软链接与硬链接
本文我们讲述一下Linux文件系统中的软链接与硬链接。
1. Linux的文件与目录
现代操作系统为解决信息能独立于进程之外被长期存储引入了文件,文件作为进程创建信息的逻辑单元可被多个进程并发使用。在Unix系统中,操作系统为磁盘上的文本与图像、鼠标与键盘等输入设备以及网络交互等IO操作设计了一组通用API,使它们被处理时均可统一使用字节流方式。换言之,Unix系统中除进程之外的一切皆是文件,而Linux保持了这一特性。为了便于文件的管理,Linux还引入了目录(有时亦被称为文件夹)这一概念。目录使文件可被分类管理,且目录的引入使Linux的文件系统形成一个层级结构的目录树。清单1
所示的是普通Linux系统的顶层目录结构,其中/dev
是存放了设备相关文件的目录。
清单1
Linux系统的顶层目录结构
/ 根目录 ├── bin 存放用户二进制文件 ├── boot 存放内核引导配置文件 ├── dev 存放设备文件 ├── etc 存放系统配置文件 ├── home 用户主目录 ├── lib 动态共享库 ├── lost+found 文件系统恢复时的恢复文件 ├── media 可卸载存储介质挂载点 ├── mnt 文件系统临时挂载点 ├── opt 附加的应用程序包 ├── proc 系统内存的映射目录,提供内核与进程信息 ├── root root 用户主目录 ├── sbin 存放系统二进制文件 ├── srv 存放服务相关数据 ├── sys sys 虚拟文件系统挂载点 ├── tmp 存放临时文件 ├── usr 存放用户应用程序 └── var 存放邮件、系统日志等变化文件
Linux与其他类Unix系统一样并不区分文件与目录:目录是记录了其他文件名的文件。使用命令mkdir
创建目录时,若期望创建的目录的名称与现有的文件名(或目录名)重复,则会创建失败:
# ls -F /usr/bin/zi* /usr/bin/zip* /usr/bin/zipgrep* /usr/bin/zipnote* /usr/bin/zipcloak* /usr/bin/zipinfo* /usr/bin/zipsplit* # mkdir -p /usr/bin/zip mkdir: cannot create directory `/usr/bin/zip': File exists
Linux将设备当做文件进行处理,清单2
展示了如何打开设备文件/dev/input/event5并读取文件内容。文件event5
表示一种输入设备,其可能是鼠标或键盘等。查看文件/proc/bus/input/devices可知event5对应的设备类型。设备文件/dev/input/event5使用read()以字节流的方式被读取。结构体input_event
被定义在内核头文件linux/input.h
中:
清单2
打开并读取设备文件
2. 硬链接与软连接的联系与区别
我们知道文件都有文件名与数据,这在Linux上被分成两个部分:用户数据(user data)与元数据(metadata)。用户数据,即文件数据块(data block),数据块是记录文件真实内容的地方; 而元数据则是文件的附加属性,如文件大小、创建时间、所有者等信息。在Linux中,元数据中的inode
号(inode是文件元数据的一部分,但其并不包含文件名,inode号即索引节点号)才是文件的唯一标识而非文件名。文件名仅是为了方便人们的记忆和使用,系统或程序通过inode
号寻找正确的文件数据块。下图展示了程序通过文件名获取文件内容的过程:
图1
通过文件名打开文件
在Linux系统中查看inode
号可使用命令stat
或ls -i
(若是AIX系统,则使用命令istat)。清单3
中使用命令mv移动并重命名文件glibc-2.16.0.tar.gz,其结果不影响文件的用户数据及inode号,文件移动前后inode号均为:2485677
清单3
移动或重命名文件
为了解决文件的共享使用,Linux系统引入了两种链接: 硬链接
(hard link)与软连接
(又称符号链接,即soft link或symbolic link)。链接为Linux系统解决了文件的共享使用,还带来了隐藏文件路径、增加权限安全及节省存储等好处。若一个inode号对应多个文件名,则称这些文件为硬链接
。换言之,硬链接就是同一个文件名使用了多个别名(它们有共同的inode)。硬链接可由命令link
或ln
创建。如下是对文件oldfile
创建硬链接:
从上面可以看到,这四个文件都具有相同的inode
号。
2.1 硬链接特性
由于硬链接是有着相同inode
号仅文件名不同的文件,因此硬链接存在以下几个特点:
-
文件有相同的inode以及data block
-
只能对已存在的文件进行创建
-
不能交叉文件系统进行硬链接的创建
-
不能对目录进行创建,只可对文件创建
-
删除一个硬链接文件并不影响其他有相同inode号的文件
请单4
硬链接特性展示
文件old.file
与hard.link
有着相同的inode号: 660650及文件权限, inode是随着文件的存在而存在,因此只有当文件存在时才可创建硬链接,即当inode存在且链接计数器(link count)不为0时。inode号仅在各文件系统下是唯一的,当Linux挂载多个文件系统后将出现inode
号重复的现象(如清单5
所示,文件t3.jpg、sync以及123.txt并无关联,却有着相同的inode号),因此硬链接创建时不可跨越文件系统。设备文件目录/dev
使用的文件系统是devtmpfs
,而/root
(与根目录/
一致)使用的是磁盘文件系统ext4
。清单5
展示了使用命令df
查看当前系统中挂载的文件系统类型、各文件系统inode使用情况以及文件系统挂载点。
清单5
查找有相同inode号的文件
# df -i --print-type Filesystem Type Inodes IUsed IFree IUse% Mounted on /dev/sda7 ext4 3147760 283483 2864277 10% / udev devtmpfs 496088 553 495535 1% /dev tmpfs tmpfs 499006 491 498515 1% /run none tmpfs 499006 3 499003 1% /run/lock none tmpfs 499006 15 498991 1% /run/shm /dev/sda6 fuseblk 74383900 4786 74379114 1% /media/DiskE /dev/sda8 fuseblk 29524592 19939 29504653 1% /media/DiskF # find / -inum 1114 /media/DiskE/Pictures/t3.jpg /media/DiskF/123.txt /bin/sync
值得一提的是,Linux系统存在inode号被用完但磁盘空间还有剩余的情况。我们创建一个5M
大小的ext4类型的mo.img
文件,并将其挂载至目录/mnt
。然后我们使用一个shell脚本将挂载在/mnt
下ext4文件系统的inode耗尽(见清单6
)
清单6
测试文件系统 inode 耗尽但仍有磁盘空间的情景
硬链接不能对目录创建是受限于文件系统的设计。现在Linux文件系统中的目录均隐藏了两个特殊的目录: 当前目录(.
)与父目录(..
)。查看这两个特殊目录的inode号可知其实这两目录就是两个硬链接(注意目录/mnt/lost+found/的inode号)。若系统允许对目录创建硬链接,则会产生目录环。
# ls -aliF /mnt/lost+found total 44 11 drwx------ 2 root root 12288 Sep 1 17:54 ./ 2 drwxr-xr-x 3 root root 31744 Sep 1 17:57 ../ # stat /mnt/lost+found/ File: `/mnt/lost+found/' Size: 12288 Blocks: 24 IO Block: 1024 directory Device: 700h/1792d Inode: 11 Links: 2 Access: (0700/drwx------) Uid: ( 0/ root) Gid: ( 0/ root) Access: 2012-09-01 17:57:17.000000000 +0800 Modify: 2012-09-01 17:54:49.000000000 +0800 Change: 2012-09-01 17:54:49.000000000 +0800 Birth: -
2.2 软链接特性
软链接与硬链接不同,若文件用户数据块中存放的内容是另一文件的路径名的指向,则该文件就是软链接。软链接就是一个普通文件,只是数据块内容有点特殊。软链接有着自己的inode
号以及用户数据块(见图2
)。因此,软链接的创建与使用没有类似硬链接的诸多限制:
-
软链接有自己的文件属性及权限等;
-
可对不存在的文件或目录创建软链接;
-
软链接可交叉文件系统;
-
软链接可对文件或目录创建;
-
创建软链接时,链接计数
i_nlink
不会增加; -
删除软链接并不影响被指向的文件,但若指向的原文件被删除,则相关软链接被称为
死链接
(即dangling link, 若被指向路径文件被重新创建,死链接可恢复为正常的软链接)
图2
软链接的访问
清单7
软链接特性展示
当然软链接的用户数据也可以是另一个软链接的路径,其解析过程是递归的。但需注意: 软链接创建时原文件的路径指向使用绝对路径较好。使用相对路径创建的软链接被移动后该软链接文件将成为一个死链(如下所示的软链接a
使用了相对路径,因此不宜被移动),因为链接数据块中记录的亦是相对路径指向:
3. 链接相关命令
在Linux中查看当前系统已挂着的文件系统类型,除上述使用的df
命令外,还可以使用mount
命令或查看文件/proc/mounts:
命令ls
或stat
可以帮助我们区分软链接与其他文件并查看文件inode号,但较好的方式还是使用find
命令,其不仅可以查找某文件的软链接,还可以用于查找相同inode
的所有硬链接(见清单8
)。
清单8
使用命令find查找软链接与硬链接
系统根据磁盘的大小默认设定了inode
的值(见清单9
),如有必要,可在格式化文件系统前对该值进行修改,如键入命令:
# mkfs -t ext4 -I 512 /dev/sda4
将使磁盘设备/dev/sda4格式化成inode
大小是512字节的ext4文件系统。
清单9
查看系统的inode值
另外,我们可以通过df -i
命令查看当前inode的使用情况:
# df -i /dev/sda2 Filesystem Inodes IUsed IFree IUse% Mounted on devtmpfs 479526 396 479130 1% /dev
上面显示inode
使用了约1%
4. Linux VFS
Linux有着极其丰富的文件系统,大体上可分为如下几类:
-
网络文件系统, 如nfs、cifs等;
-
磁盘文件系统,如ext4、ext3等;
-
特殊文件系统,如proc、sysfs、ramfs、tmpfs等;
实现以上这些文件系统并在Linux下共存的基础就是Linux VFS(Virtual File System,又称Virtual Filesystem Switch),即虚拟文件系统。VFS作为一个通用的文件系统,抽象了文件系统的四个基本概念: 文件、目录项(dentry)、索引节点(inode)以及挂载点,其在Linux内核中为用户空间层的文件系统提供了相关的接口(见图3
所示VFS在Linux系统的架构)。VFS实现了open()、read()等系统调用,并使得cp等用户空间程序可跨文件系统。VFS真正实现了上述内容: 在Linux中除进程之外一切皆是文件。
图3
VFS在系统中的架构
Linux VFS存在四个基本对象: 超级块对象(superblock object)、索引节点对象(inode object)、目录项对象(dentry object)及文件对象(file object)。
-
超级块对象代表一个已经安装的文件系统;
-
索引节点对象代表一个文件;
-
目录项对象代表一个目录项。如设备文件event5在/dev/input/event5中,其存在4个目录项对象:
/
、dev/
、input/
、event5
-
文件对象代表由进程打开的文件
这四个对象与进程及磁盘文件间的关系如图4
所示,其中d_inode
即为硬链接。为文件路径的快速解析,Linux VFS设计了目录项缓存(Directory Entry Cache,即dcache)
图4
VFS的对象之间的处理
5. Linux文件系统中的inode
在Linux中,索引节点结构存在于系统内存及磁盘,其可区分成VFS inode与实际文件系统的inode。VFS inode作为实际文件系统中inode
的抽象,定义了结构体inode
与其相关的操作inode_operation
(见内核源代码include/linux/fs.h).
清单10
VFS中inode与inode_operation
如清单10
所见,每个文件存在两个计数器:i_count与i_nlink,即引用计数
与硬链接计数
。结构体inode
中的i_count用于跟踪当前文件被访问(引用)的数量,而i_nlink则是上述使用ls -i
等命令查看到的文件硬链接数。或者说i_count
跟踪文件在内存中的情况, 而i_nlink
则是磁盘计数器。当文件被删除时,则i_nlink
先被设置成0。文件的这两个计数器使得Linux系统升级或程序更新变得容易,系统或程序可以在不关闭的情况下(即文件i_count
不为0),将新文件以同样的文件名进行替换,新文件有自己的inode
及data block
,旧文件会在相关进程关闭后被完整的删除。
清单11
文件系统ext4中的inode
清单11
展示的是文件系统ext4中对inode
的定义(见内核源码fs/ext4/ext4.h)。其中三个时间的定义可对应于命令stat
中查看到三个时间。i_links_count
不仅用于文件的硬链接计数,也用于目录的子目录数跟踪(目录并不显示硬链接数,命令ls -ld
查看到的是子目录数)。由于文件系统ext4对i_links_count
有限制,其最大数为:32000(该限制在ext4中被取消)。尝试在ext3文件系统上验证目录子目录及普通文件硬链接最大数可见
清单 11. 展示的是文件系统 ext4 中对 inode 的定义(见内核源码 fs/ext4/ext4.h)。其中三个时间的定义可对应与命令 stat 中查看到三个时间。i_links_count 不仅用于文件的硬链接计数,也用于目录的子目录数跟踪(目录并不显示硬链接数,命令 ls -ld 查看到的是子目录数)。
[参看]: