文件描述符详解（学习系统编程No.10【文件描述符】）

时间2025-09-10 23:00:39分类IT科技浏览5623

导读：引言：北京时间：2023/3/25，昨天摆烂一天，今天再次坐牢7小时，难受尽在不言中，并且对于笔试题，还是非常的困难，可能是我做题不够多，也可能是没有好好的总结之前做过的一些题目，反正就是摆烂，而且刚刚看了一下蓝桥杯的题目，头大，虽然我5个月前就意识到了，并且5个月前相信我自己也许现在看...

引言：

北京时间：2023/3/25 ，昨天摆烂一天，今天再次坐牢7小时，难受尽在不言中，并且对于笔试题，还是非常的困难，可能是我做题不够多，也可能是没有好好的总结之前做过的一些题目，反正就是摆烂，而且刚刚看了一下蓝桥杯的题目，头大，虽然我5个月前就意识到了，并且5个月前相信我自己也许现在看到这种题目的时候，不会头大，没想到啊，往日依旧啊，一点进步没有，哈哈哈！所以从明天开始，我们开始整理做过的一些题目，争取掌握一些的做题技巧，所以今天我们就开始学学什么是基础IO和文件描述符，并且承接上篇博客的有关文件操作的知识

复习文件操作

从语言层面看文件操作：

具体请看该链接博客，该博客是我之前学习C语言时，总结的有关C语言文件操作，C语言文件操作详解，想要了解C语言（也就是语言层面）的文件操作，就看上述链接就行，我们把重点放在我们的系统层面文件操作，Linux操作系统

从系统层面看文件操作：

首先第一个接口肯定是如何打开文件的接口，就让我们一起看看Linux系统中的打开文件接口 open 吧！头文件：

#include 、 #include 和 #include

具体使用方式： int open(const char *pathname, int flags); 并且此时发现，该打开文件接口的返回值是一个int类型，并且此时open接口的第二个函数是一个int flags;的参数，第一个参数我们很好理解，代表的就是我们要打开的文件名，那这第二个参数代表的是什么意思呢？

想要知道第二个参数flags代表的是什么意思，此时我们就可以通过语言层面来推测，如我们知道，在C语言中，打开文件的使用方式是使用文件名和该文件的打开方式（w 、r）来实现的，如下，FILE* fopen(const char* filename ，const char* mode)，并且发现，返回值是一个FILE*, fopen返回值类型的文件指针；所以我们可以间接的理解，系统接口open的第二个参数代表也是文件的打开方式，那么此时我们就会好奇，为什么可以使用一个整形来表示文件的打开方式呢？

所以此时为了搞定这个问题，我们就可以引出一个新的问题，搞懂这个问题，我们就搞懂了上述的问题：就是操作系统(OS)一般是如何让用户给自己传递标志位？

标志位相关知识理解：

例如：我们想要给一个函数传递好几个标志位参数，int function(int flag1,int flag2,int flag3,……);我们一般使用的肯定是如上的方法，定义非常多个变量来进行多个标志位的传递，但是如果标志位有非常多呢？所以此时操作系统就做了一个处理，使用定义宏的方式，使用位图结构来解决传递多个标志位的问题，并且位图就是使用一个比特位来表示一个标志位，一个int就可以同时至少传递32个标志位，所以本质就是，位图的0/1结构可以代表非常多不同的值，从而通过这些不同的值，操作系统就可以识别出到底传了多少个标志位和这些标志位分别是什么，如下图所示：

所以此时我们就可以通过二进制标志位的方式来进行参数的传递，本质就是通过定义各种宏，代表相应的二进制标志位的值，然后通过按位与（&）的方式来限制这些宏执行的条件，并且通过按位或（|）的方式来表示同时可以执行的行为，所以此时我们就可以通过传递宏的方式来获取我们想要让代码执行的行为 如下图：

所以明白了上述的有关标志位的知识，此时我们就可以很好的理解，为什么系统调用接口open的第二个参数是一个整形参数，并且返回值也是一个整形了，就是因为操作系统在设计接口的时候，是通过标志位的形式来封装各种的有关文件读写权限，例如上述的1可以表示是读权限等！只有我们传递给操作系统接口的值为1或者为定义1的这个宏，此时我们才可以访问到系统调用中的文件打开的读权限（上述的 if

语句判断和按位与就行前提），所以如下图，就是操作系统中有关文件打开权限的宏定义，我们想要通过某种权限打开文件，此时就需要通过这些宏进行传参（本质就是标志位的传参）如图：就是系统中文件打开权限表示，宏定义

总结：未来我们封装一个函数 ，就可以给这个函数设置不同的标志位，并且将每一个标志位定义一个宏，最后在函数内部对宏值做判断，函数外部就可以通过宏的传递，进行相应标志位代表的行为的调用，这个也就是操作系统实现系统调用的一个常规设计思路

搞定了上述知识，此时我们就可以正式的来看一看什么是系统层面的文件操作了，但这边浅浅的再谈一句，就是例如C语言中的‘w’‘r’‘a’权限，本质都是通过对我们上述所说的对系统宏定义的标志位进行的再一次用户级封装而已；所以我们此时就可以理解， int open(const char *pathname, int flags);打开文件接口中的第二个参数int flags表示的意思和用法了 ，并且明白只要打开文件就一定要关系文件，所以在系统中关闭文件的接口close ，头文件#include <unistd.h>，使用方法： int close(int fd); fd表示的意思就是打开文件后的那个返回值，同理C语言中，打开文件后的那个指向文件的指针，如下代码就是一个文件创建并打开，int fd = open(LOG, O_WRONLY | O_CREAT);使用两个宏定义的方式来表示读取文件和创建文件，但是如果此时按照上述写，我们可以发现，我们的LOG代表的文件的权限是乱码，所以此时就涉及到了创建文件是需要权限的问题，表示的意思就是，我们创建一个文件，一定需要给与这个文件相应的权限才可以，如果没有给，系统默认就是乱码，此时就引出有关文件打开的另一个参数模板， int open(const char *pathname, int flags, mode_t mode);这个模板就可以很好的解决上述的问题，可以让我们打开文件，创建文件的同时，赋予这个文件一定的权限，具体使用如下：int fd = open(LOG, O_WRONLY | O_CREAT, 0666); 这里的0666表示的就是赋予这个文件读写执行的所有权限，具体可以参照Linux权限那一节的相关知识（可以直接使用二进制来修改权限），Linux系统的权限问题，本质就是因为：100,010,001分别代表的是一个文件的读写执行权限，所以默认一个文件的创建就是拥有读写权限，所以我们添加的权限就是666权限（一个6表示读写权限，但是因为文件分为拥有者、所属组、other）所以是666权限，但是前提是不受umask影响，所以需要把umask设置为0 ，具体代码如下图：

搞定了打开和关闭文件，此时我们就来看一看如何写入、追加和读取文件中的数据，写入数据，头文件：#include <unistd.h>，使用方式： ssize_t write(int fd, const void *buf, size_t count);表示的意思：将buf数组中的大小为count的数据写入到fd被打开文件中 ，但是要注意，如果只使用原来的文件打开方式，在我们往文件中写入数据的时候，此时就不可以像C语言文件操作一样，文件内部会自己清空文件中的数据，所以在我们如果想要让文件打开时自动将文件中的内容清空，那么就需要在打开文件的时候多加一个宏定义的标志位，如该代码：int fd = open(LOG,O_WRONLY | O_CREAT | O_TRUNC,0666);多加了一个标志位，才可以让系统实现清理被打开文件的效果；搞定了写入，此时我们就来看看追加，本质追加就是一种写入，所以可以和上述的原理一样，我们只要把文件的打开方式改动一下，就可以了，如该代码： int fd = open(LOG, O_WRONLY | O_APPEND | O_CREAT,0666); ，所以只需要在打开文件的时候，加一个 O_APPEND 的宏定义标志位就行啦！并且将自动清理标志位去掉，因为自动清理标志位和追加标志位是矛盾的；搞定了追加，我们就再来看看什么是读取文件，同理：头文件 #include <unistd.h> ，基本使用方式：ssize_t read(int fd, void *buf, size_t count);表示可以将一个fd被打开文件中的数据按照count大小读取到buffer数组中，具体使用如该代码ssize_t n = read(fd,buffer,sizeof(buffer)-1); ，减一的原因在于，C语言文件操作和系统文件操作是不同的，C语言文件操作需要以\0结尾，但系统文件操作没有这个规定，并且还要注意的是，文件的打开方式需要发生改变， int fd = open(LOG,O_RDONLY)需要以读的方式来打开，并且因为读取文件已经存在，所以不需要给给权限，使用普通的系统文件打开接口就行

所以部分的文件打开方式如下：

本质就是可以通过宏定义的标志位来实现不同的行为，并且要注意文件打开方式不同，相应的读取、写入、追加效果都是不同的，所以注意要匹配使用！

总：还是那句话，任何语言中的文件操作，无论是读写还是追加等，都是像上述一样通过封装各种的宏定义标志位实现，也就是通过封装各种的系统调用接口实现而已

所以文件操作的本质都是被打开文件和进程之间的关系，我们学习的目标也就是进程和被打开文件之间的关系 ，所以按照内存来看，就是struct task_struct;和struct file;之间的关系，也就是进程控制块和文件对象之间的关系，所以无论是什么语言，都不可能直接跳过操作系统，直接去访问硬件，而是必须通过操作系统，进而贯穿体系结构，然后再间接访问到硬件，所以总的来说一句话，各种语言的本质都是对操作系统的系统调用接口进行的封装

体系结构图如下：

文件描述符

谈谈什么是文件描述符：

承接上述，我们把系统层面的文件操作给搞明白了，但是只是明白了像标志位传参这种比较表面的知识，所以接下来我们就谈谈像文件描述符这种比较内部的知识，所以什么是文件描述符呢？文件描述符就是，当我们打开一个文件之后，这个文件会有一个返回值int ，我们一般使用 fd 来表示，所以此时这个被打开文件的fd返回值，就是我们要学习的文件描述符，所以这个返回值具体是用来干什么的呢？

想要明白这个问题，此时就要从别的知识点或者别的概念迁移，例，任何一个进程在启动的时候，默认会打开当前进程的三个文件：标准输入、标准输出和标准错误，如下表：

语言标准输入标准输出标准错误 C语言 stdin stdout stderr C++ cin cout cerr

所以无论是标准输入、标准输出还是标准错误，本质上这些东西都是文件而已，如下图：

因为Linux系统下一切皆是文件，所以，向显示器打印，本质就是向文件中写入，如何理解？

所以抽象成：

标准输入–设备文件–键盘文件

标准输出–设备文件–显示器文件

标准错误–设备文件–显示器文件

所以得出结论，任何一个进程启动，默认就是会直接打开三个文件，标准输入、标准输出和标准错误，这三个文件是不需要我们使用系统接口open来打开的，系统默认就是打开，所以此时我们明白，在我们自己使用open接口打开文件之前，系统就已经默认打开了三个文件（标准输入、标准输出和标准错误），所以明白了这点，我们就应该还可以明白，我们自己使用open打开的文件是存在返回值的，那么这三个文件肯定也是存在返回值的呀，所以，此时操作系统就规定，在文件描述符中，0表示标准输入，1表示标准输出，2表示标准错误，也就是表示，这三个默认打开的文件，它们默认的返回值就是0 1 2 ，也就意味着如果此时去打开一个新的文件，它的文件描述符只能从3开始，再打开一个文件文件描述符只能是4… ，所以文件描述符不仅代表的是文件打开后的返回值，本质上就是文件的编号，也就是文件的一个别名，以后操作系统就可以利用这些文件描述符，0 1 2 3 4 ，更加快速的找到对应的文件，所以这就是文件描述符的好处

并且从另一个方面来看问题，也就是操作系统可以利用这些文件描述符来管理文件，那么这些文件描述符的在操作系统内部本质上是什么呢？不难理解，从0 1 2 3……开始，这不就是一个数组吗？这不就是数组下标吗？所以本质上操作系统通过文件描述符对文件进行管理，本质就是通过数组（线性表）的方式对文件进行管理（增删查改）

被打开文件和进程之间的联系

所以当用户想要访问一个文件，操作系统一定要先管理好文件对象，问题，对应的打开文件的并不是文件自己，而是用户通过进程的方式通过操作系统去打开一个文件，所以还是要以进程的形式去访问文件，所以本质上还是在谈被打开文件和进程之间的关系，从操作系统来看也就是进程pcb和struct file之间的关系

但是要注意：一个进程是可以打开多个文件的，就比如我们在代码中调用了多次的open接口，此时就可以同时打开很多个文件，所以进程和文件之间的关系不是1 ：1 ，而是n ：1

如下代码：

并且操作系统为了能够让进程快速的找到文件，所以操作系统内部是这样维护文件的：定义一个数据结构，struct file_struct ，这个数据结构是一个数组结构，并且是一个指针数组 ，该数组中的数据是一个一个的 struct file*fd_array[] 的指针，这个结构体就是用来和上述的文件对象结构体struct file挂钩的，也就是用来存储这些文件对象的地址的，并且我们的进程pcb中还包含了一个struct files_struct*files；的一个结构体指针对象（本质上是因为，一个文件加载到内存，是先加载该文件对应的进程属性，也就是进程pcb，而不是加载代码和数据），并且需要通过该进程pcb快速的找到相应的文件对象

具体如下图所示

：

图例文字描述：

当从磁盘中加载一个文件到内存之时，操作系统根据先描述再组织，管理文件，为文件创建一个struct file对象，创建之后，因为这个打开的行为一定是某个进程让操作系统打开的，所以此时操作系统就会找到这个进程的pcb ，在找到这个pcb的同时，会把内存中对应struct file对象的地址放到struct files_struct这个结构体数组为空的下标中，所以找到进程pcb后，操作系统就可以通过该进程pcb中的*files指针，找到该数组，进而找到某个下标对应的文件对象，然后把该数组对应的下标（也就是文件描述符）返回给进程的调用者（也就是用户），所以当我们打开一个文件，此时就肯定会对应着有一个文件描述符，也就是有一个数组下标，这也就是进程和被打开文件之间的关系导致的，进而通过进程（可执行文件），我们就可以对相应的文件进行操作了。总：文件描述符的本质就是一个数组下标

感兴趣可以参考该链接：文件描述符详解

深入缓冲区

搞定了上述有关文件描述符的知识，此时我们就可以来看看和文件描述符息息相关的缓冲区的知识了，操作系统会将文件对象对应的缓冲区中的数据给刷新到外设中（磁盘），所以本质我们使用的write 、read函数，都是拷贝函数，它们可以把我们想要写入的数据（字符串），给拷贝到文件对象对应的缓冲区中，并且注意：操作系统具体什么时候刷新缓冲区的数据是有操作系统自己决定的（例如：可以是在缓冲区中的数据满了再刷新，也可以是没满的时候，因为别的原因刷新，都是可能的），反正就是按照自己的刷新策略进行刷新，上述是写入到缓冲区的情况，读取本质上是同理的，但是是先找到在磁盘上的文件，然后把磁盘上的文件拷贝到对应的缓冲区中，然后再把该缓冲区的数据拷贝到我想要拷贝到的文件中（这个就是读取），本质还是通过缓冲区来完成的，所以下述让我们通过理解为什么一切皆文件，来深入了解缓冲区，如下：

如何理解一切皆文件：

首先我们要明白一个点，就是所有的外设你想要和它进行交互，也就是允许它供给我们的使用，那么这些外设就要有相应的读写方法，因为只有读写方法，我们才可以向该外设写入数据或者是向该外设读取数据，所以外设就为我们提供了相应的驱动程序，我们就可以通过相应的驱动程序来访问和使用对应的外设了，如下图所示：

所以在我们上述所说的一个文件被加载到内存时，此时这个文件对象中的众多属性中，就会包含一个有关读写数据的函数指针，通过这两个指针，就可以访问到相应的需要访问到的外设驱动程序上对应的读写函数，间接就可以调用相应的外设来帮我们完成文件中代码和数据需要的功能实现，所以此时我们就以我们的键盘（外设）为例，来看一看进程和被打开文件之间的关系到底是怎样的吧！

首先，我们创建了一个可执行文件，并且此时该文件中的代码和数据包含了调用系统接口open的代码，我们使用open去打开了一个在磁盘中安静睡觉的文件，此时操作系统就会帮我们去把该文件对应的部分数据和属性加载到内存，并且生成一个struct file的结构体对象来存储，并且会把该结构体对象的地址给给一个struct files_struct的顺序表类型结构体(目的：提高效率) ，并且此时这个结构体对象此时除了包含着该文件对应简单的属性之外，还有操作系统给与它的各种权限和功能，例如：可以通过结构体中的两个指针去访问任意外设的驱动程序上的有关读写函数（此时就可以将对应的数据拷贝到驱动程序之中），生成了struct file之后，此时我们自己的可执行文件（进程），操作系统为了管理这个进程，就会像管理文件一样，为该进程生成一个结构体 strcut task_struct ，并且该结构体和struct file结构体一样，它其中不仅有该进程对应的部分属性，也有一个指针（struct files_struct* file），通过该指针，该进程就可以找到文件描述符表（就是一个存放各种文件对象的地址的数组），所以此时进程中的代码和数据中的open接口，就找到了对应的文件描述符表中的下标，也就是相应我们要打开的文件.

所以访问键盘的本质就是在通过一个文件对象中的函数指针访问键盘驱动程序中的读写函数，而我们的进程却只需要将对应文件中的代码和数据拷贝到相应的文件对象中的缓冲区就行，所以对于进程来说，它本质上只需要和被打开文件进行交互，剩下的向外设或者从外设写入和读取的操作，都只要交给文件对象（文件结构体）中的函数指针去完成就行了，所以对于进程来说，操作系统中的程序都是文件，因为它本质上只需要和文件对象进行交互，剩下和外设驱动程序之间的交互都只需要交给文件对象自己去完成就行了。

总结：今天踏实了许多，该博客也踏实了许多，很多知识掌握的还是比较扎实，所以慢就是快的理论还是很有道理的。