Linux内核笔记--深入理解文件描述符
内核版本:linux-2.6.11
文件描述符(file descriptor)在Linux编程里随处可见,设备读写、网络通信、进程通信,fd可谓是关键中的关键。
深入理解可以增加我们使用它的信心。
该篇笔记主要解释了文件描述符底层的多态实现和文件描述符的生命周期。希望对自己和大家有所帮助。
先看三段简化后的内核代码
sys_open
fd = get_unused_fd();
if (fd >= 0) {
struct file *f = filp_open(tmp, flags, mode);
fd_install(fd, f);
}
sys_socket
fd = get_unused_fd();
if (fd >= 0) {
struct file *file = get_empty_filp();
fd_install(fd, file)
}
do_pipe
struct file *f1 = get_empty_filp();
struct file *f2 = get_emtpy_filp();
i = get_unused_fd();
j = get_unused_fd();
fd_install(i, f1);
fd_install(j,f2);
fd[0] = i;
fd[1] = j;
这三段代码分别是三个POSIX标准系统调用open
,socket
,pipe
的内核态例程,
简化后的代码可以清楚看到,文件描述符的获取和安装在不同模块中都有着几乎相同的套路。
get_unused_fd
顾名思义,它从当前进程描述符中的打开文件数组(current->files)里取得一个空闲的项,然后返回其数组下标。filp_open
最终将调用get_empty_filp
,因此三段代码都使用get_empty_filp
分配了一个新的文件对象(struct file)。fd_install
将上一个步骤创建的文件对象指针存到该进程的打开文件数组中。
至此,文件描述符安装完毕,返回的fd即为该文件对象在当前进程的task_struct中的files数组中的下标,也就是所谓的文件描述符,但究其本质,我们对文件描述符的所有使用其实就是在操作file对象。
接下来就是程序员最拿手的read,write,以及各种IO控制了。
file作为一个通用的结构体,在不同模块表示的对象是不同的,在文件系统中,它表示为一个文件,在进程通信中,它表示为一个管道,在网络通信中,它又表示为一个套接字。
那么问题来了,作为一个通用的结构体,在表示为不同的通信对象的时候,操作函数肯定是不同的,举个例子来说,write一个文件和write一个socket肯定是不一样的,那么同一个函数入口怎么做到多态的实现呢?
我们同样用write来解释,write()
->sys_write()
->vfs_write()
->file->f_op->write()
,重点在write调用流程的最后一步file->f_op->write()
,从这里开始,针对不同的file对象将进入不同的write实现。这是因为不同file里注册的各类操作函数是不同的。
struct file中的f_op指针,指向一系列函数指针的集合,这个结构名叫file_operation
,这一系列函数指针都指向着当前这个file对象(设备也好,管道也好,套接字也好)对应的各种操作函数的具体实现。
在2.6.11的内核里看起来如下:
struct file_operations {
struct module *owner;
loff_t (*llseek) (struct file *, loff_t, int);
ssize_t (*read) (struct file *, char __user *, size_t, loff_t *);
ssize_t (*write) (struct file *, const char __user *, size_t, loff_t *);
int (*ioctl) (struct inode *, struct file *, unsigned int, unsigned long);
...
}
以ext3文件系统为例:
struct file_operations ext3_file_operations = {
.llseek = generic_file_llseek,
.read = do_sync_read,
.write = do_sync_write,
.ioctl = ext3_ioctl,
.mmap = generic_file_mmap,
.open = generic_file_open,
...
};
这里使用了C99的语法,始化了一个file_operations然后用自己的实现去填充一个个的函数指针,在open一个ext3文件系统中的文件时,会将这个file_operations注册到新建的这个file对象里。
同样,在pipe.c、socket.c里也可以看到类似的注册file_operations的行为。
所以,一个file是文件、是设备、是管道还是套接字,就是根据其中存放的file_operations来区分,
在创建file的时候就会针对这个file的类型注册不同的操作函数,这就解释了同一个通用函数的多态实现。
文件描述符的生命周期:
- 创建file对象
- 根据IO对象的类型注册各个操作函数(注册file_operations)
- 将file对象的指针注册到进程描述符的files数组里的fd下标处
- read、write等等IO操作
- 调用close(fd)释放file对象
Linux内核笔记--深入理解文件描述符的更多相关文章
- Linux内核分析:打开文件描述符实现
在Linux中每一个进程的数据是存储在一个task_struct结构(定义在sched.h中)中的. struct task_struct { volatile long state; /* -1 u ...
- Linux 利用进程打开的文件描述符(/proc)恢复被误删文件
Linux 利用进程打开的文件描述符(/proc)恢复被误删文件 在 windows 上删除文件时,如果文件还在使用中,会提示一个错误:但是在 linux 上删除文件时,无论文件是否在使用中,甚至是还 ...
- 修改Linux系统下的最大文件描述符限制
通常我们通过终端连接到linux系统后执行ulimit -n 命令可以看到本次登录的session其文件描述符的限制,如下: $ulimit -n1024 当然可以通过ulimit -SHn 1024 ...
- 并发时-修改Linux系统下的最大文件描述符限制
通常我们通过终端连接到linux系统后执行ulimit -n 命令可以看到本次登录的session其文件描述符的限制,如下: $ulimit -n1024 当然可以通过ulimit -SHn 1024 ...
- Linux 进程级开启最大文件描述符 调优
开启最大文件数 系统可以开启的最大文件描述符(可同时开启最多的文件数),最大开启65535,可根据需求进行调优. 查看系统当前可开启最大文件描述符数 ulimit -n [root@localhost ...
- Linux 套接字与文件描述符
端口和套接字,用于确定指定主机上的哪个本地进程使用了哪个协议和哪台远程主机上的哪个进程进行了通信.端口和套接字的使用可以基于以下几点: ①为每个应用过程分配一个过程标识符(Process ID),每次 ...
- 【Shell脚本学习指南笔记】重定向文件描述符 2>&1
如: make > results 2>&1 重定向 > results让文件描述符1(标准输出)作为文件results,接下来的重定向2>&1有两个部分.2& ...
- Linux中的文件描述符与打开文件之间的关系
Linux中的文件描述符与打开文件之间的关系 导读 内核(kernel)利用文件描述符(file descriptor)来访问文件.文件描述符是非负整数.打开现存文件或新建文件时,内核会返回一个文件描 ...
- Linux的进程、线程、文件描述符是什么
说到进程,恐怕面试中最常见的问题就是线程和进程的关系了,那么先说一下答案:在 Linux 系统中,进程和线程几乎没有区别. Linux 中的进程就是一个数据结构,看明白就可以理解文件描述符.重定向.管 ...
随机推荐
- synchronized使用说明
好久没有更新博客了,今天试着用简单的语言把synchronized的使用说清楚. synchronized是什么? synchronized是用来保证在多线程环境下代码同步执行的可重入的互斥锁.所谓互 ...
- iOS 25个性能优化/内存优化常用方法
1. 用ARC管理内存 ARC(Automatic ReferenceCounting, 自动引用计数)和iOS5一起发布,它避免了最常见的也就是经常是由于我们忘记释放内存所造成的内存泄露.它自动为你 ...
- 完美解决IE(IE6/IE7/IE8)不兼容HTML5标签的方法
完美解决IE(IE6/IE7/IE8)不兼容HTML5标签的方法 HTML5的语义化标签以及属性,可以让开发者非常方便地实现清晰的web页面布局,加上CSS3的效果渲染,快速建立丰富灵活的web页 ...
- Sql Server函数全解<二>数学函数
阅读目录 1.绝对值函数ABS(x)和返回圆周率的函数PI() 2.平方根函数SQRT(x) 3.获取随机函数的函数RAND()和RAND(x) 4.四舍五入函数ROUND(x,y) 5.符号函数SI ...
- BZOJ 4184: shallot
Description 在某时刻加入或删除一个点,问每个时刻的集合中能异或出来的最大值是多少. Sol 线段树+按时间分治+线性基. 按时间分治可以用 \(logn\) 的时间来换取不进行删除的操作. ...
- DevExpress 隐藏Ribbon中barbuttonItem的SuperTip(2)
在form界面增加 toolTipController 工具 然后将 ribbonControl.ToolTipController 的属性设置成 toolTipController toolTipC ...
- java.lang.IllegalStateException: Cannot add header view to list -- setAdapter has already been called.
分析:android 4.2.X及以下的版本,addHeaderView必须在setAdapter之前,否则会抛出IllegalStateException. android 4.2.X(API 17 ...
- VC++ : error LNK2001: unresolved external symbol "__declspec(dllimport) public: __thiscall std::basic_string<wchar_t,struct std::char_traits<wchar_t>
最近学习Google Breakpad,将其用在了自己的项目中,编译的版本为VS2010,没有什么问题.但是为了和之前的程序兼容,需要使用VS2008版本的程序,于是又编译了VS2008版本的代码,但 ...
- iOS 修改状态栏preferredStatusBarStyle不执行问题
一.在老版本的iOS中,状态栏永远都是白色风格.而在iOS 7中,我们可以修改每个view controller中状态栏的外观.通过UIStatusBarStyle常量可以指定状态栏的内容是暗色或亮色 ...
- C++根据图片url下载图片
需要使用到URLDownloadToFile()函数,该函数在头文件<urlmon.h>中声明. URLDownloadToFile()函数的定义如下: HRESULT URLDownlo ...