硬盘不分区?" />
英文原文:Why is Linux's filesystem designed as a single directory tree?
有人可以给我解释一下,为什么 Linux 的文件系统是「单目录层阶树状」结构,而不像 Windows 那样有个 C:\ D:\ 分区啥的,这样做有没有特别的原因呢?
(小编注:苹果 Mac OS 和 Linux 都是 Unix 的分支,所以题目我就…… ╮(╯▽╰)╭ )
Doug O'Neal 163 票
说起来 Unix 的文件系统的道行要比 Windows 的早很多年,所以您的问题得改成:「为什么 Windows 要自搞一套弄出个硬盘分区符号来呢?」
树状的文件结构有个优势就是任何子目录或者文件,都能顺着根目录找到。所以,如果你需要把本地文件迁移到一个网络硬盘上,这时候对于软件来说,它们不会察觉到任何区别。
假设你有一套系统,操作系统焊死不能动,但是有个程序有很高的I/O需求,那么你可以很方便地把 /usr 目录加载为只读,然后吧 /opt(应用程序安装目录)目录加载到一块 SSD 上。这样整个文件系统的结构对于操作系统来说没有发生任何改变。然而在 Windows 下,这种问题就比较讨厌,特别是程序路径前面带着个 C:\Program Files\ 的时候……
Gilles 70 票
这都是有历史原因在里面的,部分上是因为这样做在当时更有效。
Multics
Multics 是我所知的历史上第一个采用「层阶树状文件结构」的操作系统,一个目录里还嵌着子目录这种机制。引用 R.C. Daley 和 P.G. Neumann 的《通用辅助文件存储(A General-Purpose File System For Secondary Storage)》一文中的话:
论文第二部分阐述了一种「层阶树状文件结构」的文件系统,对于操作系统来说,它非常高效。这种结构兼顾了可靠性和灵活性……
为了便于理解,我们可以把这种结构想象成一棵树,文件的树,其中有一些目录其实也是文件。但是有一个例外的目录,它自身的指针只指向一个单一的,确定的目录,那就 Root 目录。它没有明确地被其他目录所指,root 目录只是隐式地代表一个虚拟的分支,我们称这个分支结构为「文件系统」。
在任何时候,用户都处于一个目录下面,我们称它为「工作目录(working directory)」,用户可以通过指定入口访问工作目录下面的文件。而且多个用户可以同时工作在同一个工作目录之下。
在其他各个方面,Multics 追求的是灵活性,用户只需工作在整个文件系统的一条分支上,其他的不用管,但还能保证用目录管理文件的便捷性。目录还被用来控制访问权限 —— 目录的 READ 属性允许用户访问目录中的文件,而 EXECUTE 属性允许用户修改目录中的文件 (这个特性被后来的 unix 系统继承下来)。
Multics 还遵循了「单一存储对象池」的设计原则。但是论文没有在这方面展开。「单一存储对象池」对于当时的硬件条件来说非常合适,那时候没有可移动的硬盘,起码是没有人关心这个问题。Multics 确实有一个备用的备份存储池,但对于用户来说,它是不存在的。
Unix
Unix 系统深受 Multics 的影响,但是比起 Multics 的「灵活」,Unix 更专注于加强系统的「简洁」。
「单一目录树层级」的文件系统就很适合 Unix 系统。就和 Multics 一样,存储池的细节,经常不需要用户关心。但是后来出现了可拆卸的硬盘, Unix 通过 mount 和 umount 两个命令把对存储设备的操作暴露给用户(只有「管理员权限」的用户才能执行这样的操作)。在 《Unix 分时系统设计(The Unix Time-Sharing System)》一文中, Dennis Ritchie 和 Ken Tompson 解释道:
虽然系统根目录一般都在同一个存储设备上,但是对于其他分支目录则未必要这样做。出于两种考虑,我们需要 mount 命令完成存储设备挂载的工作:普通文件的文件名一致性,和文件所在的存储设备可能有其独立的文件存储结构。通过 mount 命令,可以把之前的一个文件,替换成一个可移动存储设备上的完整的目录结构,事实上,mount 命令把文件层级的某一部分,通过引用外部数据,替换成一个新的结构。这样对于之前整个文件系统来说,没有发生任何改变。其实,拿我们的系统安装过程举例,root 目录一直在我们的硬盘上占了一小块地方,但其他用户数据在不同的硬盘上,通过 mount 机制,按序列加载组成一个初始化的系统。一个「可挂载」的系统,完全是通过读写特殊文件完成的。各种应用可以创建自己的文件系统,或者简单地从他处拷贝一份。
(小编注:上面这段文字的中心思想:在 UNIX 中,一切都是文件。)
「层阶树状文件系统」还有一个优势,就是可以把管理存储设备的复杂任务交给内核处理,这就意味着内核虽然越来越复杂,但是对于建立其上的应用来说,其结果就是保持简洁。因为内核已经把脏活累活都包了,大部分应用都不用关心这部分细节,这是一种更加自然的设计。
Windows
Windows 系统流淌着两支古老血脉:设计运行在 VAX 微机上的 VMS 操作系统,和早期 Intel 微机(如 8080、Z80) 上运行的 CP/M 操作系统。
VMS 有一个分布式的层级文件系统,叫做 Files-11。在 Files-11 中,一个文件的完整路径包括一个「节点名称」、一个关联的用户账户、设备名称、目录树、文件名和文件类型,以及版本号。VMS 有强大的 Logical Names 功能,这个功能允许自定义「快捷方式」到指定的路径,所以用户不需要在意目录的「真实」路径。
CP/M 是为了 64kB 的内存和软盘系统设计的,为了一切从简,所以从诞生起,它就没有「目录」这个概念,但是文件是通过引用「驱动器位置」来访问的,比如 A: 或者 B:
而 MS DOS 1.0 继承了 CP/M 的这个特性,所以,当 MS DOS 2.0 引入「目录」的概念以后,为了兼容 1.0 也在路径钱保留了「盘符」字符,而斜杠「/」符号是原来 VMS 和 CP/M 系统中表示「命令参数开始」的符号,所以后来的 DOS 以及 Windows 必须区分,而采用了反斜杠「\」 符号作为路径分隔符。
Windows 继承了 DOS 和 VMS 的习惯,虽然已经意义不大,但是依旧保留着「盘符」的传统。如今,在 Windows 底层,采用的是 UNC 路径(通用命名规则,即 \servername\sharename 的规范),但这只是一些高级 Windows 用户需要知道的功能,Windows 现在确实可以通过「重解析点」(Reparse Points)来挂在存储设备。(所以不需要C:这样的盘符了)