24小时学通Linux内核之有关Linux文件系统实现的问题

　　有时间睡懒觉了，却还是五点多醒了，不过一直躺倒九点多才算起来，昨晚一直在弄飞凌的嵌入式开发板，有些问题没解决，自己电脑系统的问题，虽然Win10发布了，，但我还是好喜欢XP呀，好想回家用用家里的XP来玩玩这块板子，不知不觉也第五天了，感觉代码都有些模糊，连自己都不是很清楚了，担心现在分享起来比较困惑，各路大神多加批评呀，觉得渣渣的尽量指正出来，拉出来批评，今天还是来总结一下有关Linux文件系统的问题吧~
　　Linux的使用和用户空间程序的编程和文件系统有着密切的关系，文件系统的概念大家应该都有些熟悉，这里我不多说，因为说了也和大家以前讲解的一样，这些概念能了解就是了，大家想了解随便都能百度得到。首先我来说下Linux的虚拟文件系统。文件系统的实现因系统的不同而不同，Linux最好的特性之一是他支持许多文件系统，文件系统的构造如下图：

上图中VFS(虚拟文件系统)依赖数据结构来保存其对一个文件系统的一般表示，其中数据结构罗列如下：

超级块结构：存放已经安装的文件系统的相关信息；
索引结点结构:存放有关文件的信息；
文件结构：存放被进程打开的文件的相关信息；
目录项结构：存放有关路径名和路径名所指向的文件的信息。

　　Linux内核使用全局变量来保存先前提到的指向结构体的指针，所有的结构都用双向链表保存，内核保存指向链表头的指针，并且把它作为链表的访问点，这些结构都用list_head类型的域，用它来指向链表中的前一个元素，下表是内核保存的全局变量以及这些变量指向的链表类型(与VFS相关的全局变量）

全局变量	结构类型
super_blocks	super_block
file_systems	file_systems_type
dentry_unused	dentry
vfsmntlist	vfsmount
inode_in_use	inode
inode_unused	inode

　　super_block、file_system_type、dentry、vfsmoubt结构都保存在它们自己的链表中，索引结点能够在全局的inode_in_use上或者inode_unused上找到自己，或者它们对应的超级快的局部链表上都可以找到自己。

　　除了主要的VFS结构之外，还有几个其他的结构与VFS相互作用，fs_struct和files_struct,namespace,fd_set，下图讲诉了进程描述符是如何与文件相关的结构相关联的。

先来介绍fs_struct结构，fs_struct结构可以被多个进程描述符引用，下述代码在include/Linux/fs_struct.h中可以查到哦,代码解释不好的请大神指教

struct fs_struct{

    atomic_t count;　　//保存引用特定fs_struct的进程描述符数目

    rwlock_t lock;

    int umask;　　//保存一个掩码，表示将要在打开文件上设置的许可权

    struct dentry * root, *pwd ,*altroot;　　//都是指针，，，，

    struct vfsmount * rootmnt, *pwdmnt,  *altrootmnt;　　//指针，

};

files_struct包含打开文件和其描述符的相关信息，它使用这些集合来对它的描述符进行分组。下面代码在include/linux/file.h上可以查看到

struct files_struct{

    atomic_t count;　　//与fs_struct类似

    spinlock_t file_lock;

    int max_fds;　　//表示进程能够打开的文件的最大数

    int max_fdset;　　//表示描述符的最大数

    int next_fd;　　//保存下一个将要分配的文件描述符的值

    struct file ** fd;　　//fd数组指向打开的文件对象的数组

    fd_set *close_on_exec; //是指向文件描述符集的一个指针，这些文件描述符在exec()时候就被标志位将要关闭，如果在exec()时候被标志位“打开”的文件描述符数超过close_on_exec_init域的大小，则改变close_on_exec域的值；

    fd_set *open_fds; //是一个指针，指向被标记为“打开”的文件描述符集合，

    fd_set close_on_exec_init;　　//保存一个位域，表示打开文件对应的文件描述符

    fd_set open_fds_init;　　　　//这些都是fd_set类型的域，其实都不懂，，，

    struct file *fd_array[NR_OPEN_DEFAULT];//fd_array数组指针指向前32个打开的文件描述法

};

通过INIT_FILES宏初始化fs_struct结构：

#define INIT_FILES \

{

    .count = ATOMIC_INIT(),

    .file_lock = SPIN_LOCK_UNLOCKED,

    .max_fds = NR_OPEN_DEFAULT,

    .max_fdset = __FD_SETSIZE,

    .next_fd = ,

    .fd = &init_files.fd_array[];

    .close_on_exec = &init_files.close_on_exec_init,

    .open_fds = &init_files.open_fds_init,

    .close_on_exec_init = {{, }},

    .open_fda_init = {{, }},

    .fd_array = {NULL, }

}

　　NR_OPEN_DEFAULT的全局定义被设置为BITS_PER_LONG，BITS_PER_LONG在32位系统中是32，在64位系统中是64.

　　下面来介绍一下页缓冲，我们现在看看它是如何工作和实现的。在Linux中，内存被分成区，每个拥有活跃页的链表和不活跃的链表，当页不活跃的时候，就会被写回磁盘，下图说明了上述关系：

　　页缓冲的核心是address_space对象，其代码在include/linux/fs.h中可以查看(这段代码不是很懂，求大神指教)：

struct address_space{

    struct inode *host;

    struct radix_tree_root page_tree;

    spinlock_t tree_lock;

    unsigned long nrpages;

    pgoff_t writeback;

    struct address_space_operations *a_ops;

    struct prio_tree_root i_map;

    unsigned inr i_map_lock;

    struct list_head i_mmap_nonlinear;

    spinlock_t i_mmap_lock;

    atomic_t truncate_count;

    unsigned long flags;

    struct backing_dev_info *backing_dev_info;

    spinlock_t private_lock;

    struct list_head private_list;

    struct address_space *assoc_mapping;

};

　　Linux内核还把块设备上的每个扇区表示buffer_head结构，buffer_head结构应用的物理区是设备b_dev的逻辑块b_blocknr，引用的物理内存是起始于块大小为b_size个字节的b_data内存数据块，这个内存块在物理页b_page中，其结构如下图：

　　最后来说说VFS系统调用和文件系统层，并且追踪它们的执行直到内核级别，我们得先了解四个函数：open()、close()、read()、write()。

open()函数：

open 函数用于打开和创建文件。以下是 open 函数的简单描述

#include <fcntl.h>

int open(const char *pathname, int oflag, ... );

返回值：成功则返回文件描述符，否则返回 -1

对于 open 函数来说，第三个参数（...）仅当创建新文件时才使用，用于指定文件的访问权限位（access permission bits）。pathname 是待打开/创建文件的路径名（如 C:/cpp/a.cpp）；oflag 用于指定文件的打开/创建模式，这个参数可由以下常量（定义于 fcntl.h）通过逻辑或构成。

O_RDONLY 只读模式
O_WRONLY 只写模式
O_RDWR 读写模式

打开/创建文件时，至少得使用上述三个常量中的一个。以下常量是选用的：

O_APPEND 每次写操作都写入文件的末尾
O_CREAT 如果指定文件不存在，则创建这个文件
O_EXCL 如果要创建的文件已存在，则返回 -1，并且修改 errno 的值
O_TRUNC 如果文件存在，并且以只写/读写方式打开，则清空文件全部内容
O_NOCTTY 如果路径名指向终端设备，不要把这个设备用作控制终端。
O_NONBLOCK 如果路径名指向 FIFO/块文件/字符文件，则把文件的打开和后继 I/O设置为非阻塞模式（nonblocking mode）

以下三个常量同样是选用的，它们用于同步输入输出

O_DSYNC 等待物理 I/O 结束后再 write。在不影响读取新写入的数据的前提下，不等待文件属性更新。
O_RSYNC read 等待所有写入同一区域的写操作完成后再进行
O_SYNC 等待物理 I/O 结束后再 write，包括更新文件属性的 I/O

open 返回的文件描述符一定是最小的未被使用的描述符。

如果 NAME_MAX（文件名最大长度，不包括'\0'）是 14，而我们想在当前目录下创建文件名长度超过 14 字节的文件，早期的 System V 系统（如 SVR2）会截断超出部分，只保留前 14 个字节；而由 BSD 衍生的（BSD-derived）系统会返回错误信息，并且把 errno 置为 ENAMETOOLONG。

POSIX.1 引入常量 _POSIX_NO_TRUNC 用于决定是否截断长文件名/长路径名。如果_POSIX_NO_TRUNC 设定为禁止截断，并且路径名长度超过 PATH_MAX（包括 '\0'），或者组成路径名的任意文件名长度超过 NAME_MAX，则返回错误信息，并且把 errno 置为 ENAMETOOLONG。

close()函数

　　进程使用完文件后，发出close()系统调用：

　　sysopsis

#include <uniste.h>

int close(int fd);

参数：fd文件描述符

函数返回值：0成功，-1出错

参数fd是要关闭的文件描述符。需要说明的是：当一个进程终止时，内核对该进程所有尚未关闭的文件描述符调用close关闭，所以即使用户程序不调用close，在终止时内核也会自动关闭它打开的所有文件。但是对于一

个长年累月运行的程序（比如网络服务器），打开的文件描述符一定要记得关闭，否则随着打开的文件越来越多，会占用大量文件描述符和系统资源。

read()函数

　　当用户级别程序调用read()函数时，Linux把它转换成系统调用sys_read()：

功能描述：从文件读取数据。
所需头文件： #include <unistd.h>

函数原型：ssize_t read(int fd, void *buf, size_t count);

参数：

fd：将要读取数据的文件描述词。
buf：指缓冲区，即读取的数据会被放到这个缓冲区中去。
count：表示调用一次read操作，应该读多少数量的字符。

返回值：返回所读取的字节数；0（读到EOF）；-1（出错）。

以下几种情况会导致读取到的字节数小于 count ：

读取普通文件时，读到文件末尾还不够 count 字节。例：如果文件只有 30 字节，而我们想读取 100，字节，那么实际读到的只有 30 字节，函数返回 30 。此时再使用 read 函数作用于这个文件会导致 read 返回 0

从终端设备（terminal device）读取时，一般情况下每次只能读取一行。
从网络读取时，网络缓存可能导致读取的字节数小于 count字节。
读取 pipe 或者 FIFO 时，pipe 或 FIFO 里的字节数可能小于 count 。
从面向记录（record-oriented）的设备读取时，某些面向记录的设备（如磁带）每次最多只能返回一个记录。
在读取了部分数据时被信号中断，读操作始于 cfo 。在成功返回之前，cfo 增加，增量为实际读取到的字节数。

例程如下(程序是网上找的例子，贴下来以以供大家理解一下):：

 #include <stdio.h>

 #include <io.h>

 #include <alloc.h>

 #include <fcntl.h>

 #include <process.h>

 #include <sys\stat.h>

 int main(void)

 {

     void* buf ;

     int handle;

     int bytes ;

     buf=malloc();

     /*

     LooksforafileinthecurrentdirectorynamedTEST.$$$andattempts

     toread10bytesfromit.Tousethisexampleyoushouldcreatethe

     fileTEST.$$$

     */

     handle=open("TEST.$$$",O_RDONLY|O_BINARY,S_IWRITE|S_IREAD);

     if(handle==-)

     {

         printf("ErrorOpeningFile\n");

         exit();

     }

     bytes=read(handle,buf,);

     if(bytes==-)

     {

         printf("ReadFailed.\n");

         exit();

     }

     else

     {

         printf("Read:%dbytesread.\n",bytes);

     }

     return0 ;

 }

write()函数

功能描述：向文件写入数据。
所需头文件： #include <unistd.h>

函数原型：ssize_t write(int fd, void *buf, size_t count);

返回值：写入文件的字节数（成功）；-1（出错）

功能：write 函数向 filedes 中写入 count 字节数据，数据来源为 buf 。返回值一般总是等于 count，否则就是出错了。常见的出错原因是磁盘空间满了或者超过了文件大小限制。对于普通文件，写操作始于 cfo 。如果打开文件时使用了 O_APPEND，则每次写操作都将数据写入文件末尾。成功写入后，cfo 增加，增量为实际写入的字节数。

例程如下(程序是网上找的例子，贴下来以以供大家理解一下):

 #include <stdio.h>

 #include <stdlib.h>

 #include <fcntl.h>

 #include <sys\stat.h>

 #include <io.h>

 #include <string.h>

 int main(void)

 {

 int *handle; char string[];

 int length, res;/* Create a file named "TEST.$$$" in the current directory and write a string to it. If "TEST.$$$" already exists, it will be overwritten. */

 if ((handle = open("TEST.$$$", O_WRONLY | O_CREAT | O_TRUNC, S_IREAD | S_IWRITE)) == -)

 {

 printf("Error opening file.\n");

 exit();

 }

 strcpy(string, "Hello, world!\n");

 length = strlen(string);

 if ((res = write(handle, string, length)) != length)

 {

 printf("Error writing to the file.\n");

 exit();

 }

 printf("Wrote %d bytes to the file.\n", res);

 close(handle); return ; }

　　小结

　　今天看的代码不多，差不多都是网上找的代码，有些解释也是查阅资料写上去的，有些还是不懂，希望各路大神指教，这里我总结了有关Linux文件系统实现的问题，但是具体的细节方面并没有提及到，大家看了之后应该只能有一个大致的最Linux文件系统的了解，有读者问我看的是哪些书，这里我说明一下，看了Linux内核编程，还有深入理解Linux内核以及网上各种资料或者其他大牛写的好的博客。这里我是总结了一下，并且把自己不懂的还有觉得重要的说了一下，希望各位大神给些建议，thanks~

24小时学通Linux内核之有关Linux文件系统实现的问题的更多相关文章

24小时学通Linux内核之如何处理输入输出操作
真的是悲喜交加呀,本来这个寒假早上8点都去练车,两个小时之后再来实验室陪伴Linux内核,但是今天教练说没名额考试了,好纠结,不过想想就可以睡懒觉了,哈哈,自从大三寒假以来还没睡过懒觉呢,现在也有更多 ...
24小时学通Linux内核之内存管理方式
昨天分析的进程的代码让自己还在头昏目眩,脑子中这几天都是关于Linux内核的,对于自己出现的一些问题我会继续改正,希望和大家好好分享,共同进步.今天将会讲诉Linux如何追踪和管理用户空间进程的可用内 ...
24小时学通Linux内核之进程
都说这个主题不错,连我自己都觉得有点过大了,不过我想我还是得坚持下去,努力在有限的时间里学习到Linux内核的奥秘,也希望大家多指点,让我更有进步.今天讲的全是进程,这点在大二的时候就困惑了我,结果那 ...
24小时学通Linux内核--内核探索工具类
寒假闲下来了,可以尽情的做自己喜欢的事情,专心待在实验室里燥起来了,因为大二的时候接触过Linux,只是关于内核方面确实是不好懂,所以十天的时间里还是希望能够补充一下Linux内核相关知识,接下来继续 ...
24小时学通Linux内核总结篇(kconfig和Makefile & 讲不出再见)
非常开心能够和大家一起分享这些,让我受益匪浅,感激之情也溢于言表,,code monkey的话少,没办法煽情了,,,,,,,冬天的风,吹得伤怀,倒叙往事,褪成空白~学校的人越来越少了,就像那年我们小年 ...
24小时学通Linux内核之向内核添加代码
睡了个好觉,很晚才起,好久没有这么舒服过了,今天的任务不重,所以压力不大,呵呵,现在的天气真的好冷,不过实验室有空调,我还是喜欢待在这里,有一种不一样的感觉,在写了这么多天之后,自己有些不懂的页渐渐的 ...
24小时学通Linux内核之构建Linux内核
今天是腊八节,说好的女票要给我做的腊八粥就这样泡汤了,好伤心,好心酸呀,看来代码写久了真的是惹人烦滴,所以告诫各位技术男敲醒警钟,不要想我看齐,不然就只能和代码为伴了的~~话说没了腊八粥但还是有代码, ...
24小时学通Linux内核之电源开和关时都发生了什么
说实话感觉自己快写不下去了,其一是有些勉强跟不上来,其二是感觉自己越写越差,刚开始可能是新鲜感以及很多读者的鼓励,现在就是想快点完成自己制定的任务,不过总有几个读者给自己鼓励,很欣慰的事情,不多感慨了 ...
24小时学通Linux内核之调度和内核同步
心情大好,昨晚我们实验室老大和我们聊了好久,作为已经在实验室待了快两年的大三工科男来说,老师让我们不要成为那种技术狗,代码工,说多了都是泪啊,,不过我们的激情依旧不变,老师帮我们组好了队伍,着手参加明 ...

随机推荐

Codeforces Round #271 (Div. 2) D. Flowers (递推)
题目链接:http://codeforces.com/problemset/problem/474/D 用RW组成字符串,要求w的个数要k个连续出现,R任意,问字符串长度为[a, b]时,字符串的种类 ...
POJ 1064 Cable master (二分答案)
题目链接:http://poj.org/problem?id=1064 有n条绳子,长度分别是Li.问你要是从中切出m条长度相同的绳子,问你这m条绳子每条最长是多少. 二分答案,尤其注意精度问题.我觉 ...
UVaLive 7361 Immortal Porpoises (矩阵快速幂)
题意:求Fibonacci的第 n 项. 析:矩阵快速幂,如果不懂请看http://www.cnblogs.com/dwtfukgv/articles/5595078.html 是不是很好懂呢. 代码 ...
HDU 1010 Tempter of the Bone （DFS+剪枝）
题意:从S走到D,能不能恰好用T时间. 析:这个题时间是恰好,并不是少于T,所以用DFS来做,然后要剪枝,不然会TEL,我们这样剪枝,假设我们在(x,y),终点是(ex,ey), 那么从(x, y)到 ...
深度剖析WordPress主题结构(转）
利用强大的技术,可以把基于wordpress的网站做成各种各样的形式,这除了要求wordpress主题开发人员精通html,PHP,JS,CSS等技术,还需要开发者掌握WordPress主题的框架. ...
PL SQL Developer 使用总结
如果OS为windows 7 64位系统,Oracle版本为 Oracle 11g 64 安装PL SQL Developer 请参考 http://myskynet.blog.51cto.co ...
Oracle数据库的版本变迁功能对比
Oracle数据库自发布至今,也经历了一个从不稳定到稳定,从功能简单至强大的过程.从第二版开始,Oracle的每一次版本变迁,都具有里程碑意义. 1979年的夏季,RSI(Oracle公司的前身,Re ...
C# WebService的简单和复杂参数类型和结果的JSON格式
Jquery作为一款优秀的JS框架,简单易用的特性就不必说了.在实际的开发过程中,使用JQ的AJAX函数调用WebService 的接口实现AJAX的功能也成了一种比较普遍的技术手段了.WebServ ...
Eclipse下如何导入jar包【转载】
我们在用Eclipse开发程序的时候,经常想要用到第三方的jar包.这时候我们就需要在相应的工程下面导入这个jar包.以下配图说明导入jar包的步骤. 1.右击工程的根目录,点击Properties进 ...
DOS命令生成文件列表
DOS命令窗口,生成文件列表命令格式:dir xmlFiles /b >list.txt dir 文件列表相关命令 xmlFiles 待生成文件所在文件夹,在dos命令窗口根目录下,省略前缀.别 ...

24小时学通Linux内核之有关Linux文件系统实现的问题

24小时学通Linux内核之有关Linux文件系统实现的问题的更多相关文章

随机推荐

热门专题