OpenHarmony littlefs文件系统存储结构与IO性能优化分析
引言
随着科技的发展和网络技术的进步,计算机存储空间愈加紧张,存储空间对文件系统的功能需求越来越大,大规模的数据增长为文件存储、非结构化数据存储提出了新的挑战。
对于许多物联网设备而言,拥有一个小型且具有弹性的文件系统至关重要,littlefs文件系统应运而生。littlefs文件系统在2017年由Christopher Haster开发,遵循Apache 2.0协议,被应用在ARM的IoT设备Mbed操作系统。littlefs文件系统能够让嵌入式系统在ROM和RAM资源有限的情况下,还具备文件系统基本的掉电恢复、磨损均衡的功能。
littlefs是一种极简的嵌入式文件系统,适配于norflash,它所采用的文件系统结构与运行机制,使得文件系统的存储结构更加紧凑,运行中对RAM的消耗更小。它的设计策略采用了与传统“使用空间换时间”完全相反的“使用时间换空间”的策略,虽然它极大地压缩了文件系统存储空间,但是运行时也增加了RAM的消耗,不可避免地带来了随机读写时IO性能的降低。
目前,OpenAtom OpenHarmony(以下简称“OpenHarmony”) liteos_m内核采用了littlefs作为默认的文件系统。本文着重介绍了littlefs文件系统的存储结构,并根据对读写过程的分析,解析引起littlefs文件系统随机读写IO性能瓶颈的根本原因,然后提出一些提升littlefs随机读写IO性能优化策略。
littlefs文件系统结构
文件系统存储结构信息基本以SuperBlock为开端,然后寻找到文件系统根节点,再根据根节点,逐步拓展成一个文件系统树形结构体。littlefs也与此类似,以SuperBlock和根目录为起点,构建了一个树形存储结构。不同的是littlefs的根("/")直接附加在SuperBlock之后,与其共享元数据对(metadata pair)。littlefs中目录或者文件都是以该根节点为起点,构建了与其他文件系统类似的树形结构。
littlefs文件系统树形存储结构如下:
图1 littlefs文件系统树形存储结构示意图
如图1所示,存储littlefs文件系统元数据的结构为元数据对,即两个相互轮转、互为表里的Block。存储SuperBlock的元数据对固定存储在block 0和block 1,并且文件系统根目录附加在SuperBlock的尾部,与SuperBlock共享元数据对。元数据的存储是以tag的格式存储在元数据对内,按照元数据的类型,将Tag分为标准文件、目录、用户数据、元数据对尾部指针等类型。littlefs借助于这些不同类型tag信息,将littlefs文件系统组织成结构紧凑的树形存储结构体。例如tail类型的tag可以将比较大的目录结构使用多个元数据对存储,并且使用tail类型的tag将这些元数据对连接成一个单向的链表。而目录类型的tag则直接指向该目录的元数据对,例如"tag: dir_data"类型的tag指向目录"/data"的元数据对,而该元数据对中又可以包含子目录或者文件(Inline类型或者outline类型)。
littlefs目录存储结构
littlefs目录的引用为其父目录元数据对(metadata pair)内的一个dir类型的Tag,而其内容则占用一个或者多个元数据对。一个目录的元数据对内既可以包含子目录引用的Tag,也可以包含属于该目录下文件的Inline类型的Tag或者指向该文件的CTZ跳表的CTZ类型Tag指针。最终littlefs通过一层层目录或者文件的索引,组成了文件系统的树形存储结构。
littlefs文件存储方式
littlefs文件系统为极简的文件系统,使用最小的存储开销,同时实现对小文件(Bytes级别)和大文件(MB级别)的支持,对小于一个Block八分之一长度的文件,采用Inline类型的方式存储,而大于或者等于Block八分之一长度的文件则采用Outline的方式存储(CTZ Skip-list)。
1.2.1 inline文件存储方式
Inline文件存储方式,如图2所示,即将文件内容与文件名称一同存储在其父目录的元数据对(metadata pair)内,一个Tag表示其名称,一个Tag表示其内容。
图2 littlefs Inline文件存储结构
1.2.2 outline文件存储方式
Outline文件存储方式,如图3所示,文件其父目录的元数据对(metadata pair)内,一个Tag表示文件名称,另一个Tag为CTZ类型,其指向存储文件内容的链表头。
图3 littlefs Outline文件存储结构
CTZ跳表(CTZ skip-list)链表的特别之处是:
(1)CTZ跳表的头部指向链表的结尾;
(2)CTZ跳表内Block内包含一个以上的跳转指针。
若是使用常规链表,存储文件前一个数据块包含指向后一个数据块指针,那么在文件追加或者修改内容的时候,则需要存储文件起始块到目标块的所有内容拷贝到新块内,并且更新对后一个数据块的指针。而若是采用反向链表的方式,则在文件追加或者修改内容的时候,则只需要将存储文件目标块到链表结尾的块的所有内容拷贝到新块内,然后更新对后一个数据块内对前一个数据块指向的指针,这样对于文件追加模式可以减少修改量。另外,为了加快索引,采用了跳表的方式,Block内包含一个以上的跳转指针,规则为:若一个数据块在CTZ skip-list链表内的索引值N能被 2^X整除的数,那么他就存在指向N – 2^X的指针,指针的数目为ctz(N)+1。如表1,对于block 2,包含了2个指针,分别指向block 0和block 1,其它块也是采用相同的规则。
表1 littlefs 块的skip-list链表计算样表
littlefs文件读写流程
以上章节针对littlefs文件系统结构进行了分析,接下来开始探讨littlefs内部的运行机制,以读写流程为例,分析littlefs随机读写的IO性能瓶颈。
需要提前了解的是,littlefs的文件只拥有一个缓存,写时作为写缓存使用,读时作为读缓存使用。
littlefs文件读过程
以下图4是littlefs读文件的流程图,在读流程的开始先检测先前是否有对文件的写操作,即检测文件缓存是否作为写缓存。若是,则强制将缓存中的数据刷新到存储器,根据文件类型和访问位置,或者直接从文件所在的元数据对读取,或者从存储文件内容的CTZ跳表内的块内读取,再将数据拷贝到用户缓存冲,并从存储器预读取数据将文件缓冲区填满。具体过程如下:
图4 littlefs文件系统读过程流程图
littlefs文件写过程
以下图5是littlefs写文件的流程图,在写流程的开始先检测先前是否有对文件的读操作,即检测文件缓存是否作为读缓存。若是,则清除缓存中的数据。若是APPEND类型的写操作,则直接减写位置定位到文件末尾。若写位置超过文件长度,说明文件结尾与写位置间存在空洞,则使用0填充文件中的空洞。对应Inline类型文件,若推测到写后,文件长度超过了阈值,则将文件转成Outline类型。对于Outline类型的文件,若是修改文件的内容,则需要申请新块,并将目标块内访问位置之前的所有内容都拷贝到新块,将buffer中的用户数据写到缓冲区或者刷新到存储器。
注意:写后并没有立刻更新Inline文件的commit,或者更新Outline文件的CTZ跳表,这些操作被延迟在文件关闭或者缓冲区再次作为读缓存的时候强制文件刷新时更新。
图5 littlefs文件系统写过程流程图
littlefs文件随机读写IO性能瓶颈分析
littlefs文件只有一个缓冲区,为读写复用。根据littlefs运行机制,若是对文件先读后写,那么仅需要直接将缓冲区的数据清空,然后申请一个新块将目标块内访问位置直接的数据拷贝到新块中,然后写数据到新块。若是先写后读,那么需要将数据刷新到存储器,同时更新文件的CTZ跳表。在这个过程中,不仅涉及到刷新数据到存储器,而且涉及到分配新块替换目标块之后的所有块从而更新CTZ跳表,出现多次费时的擦除块动作。在随机读写的过程中,频繁发生读写切换,也就频繁地发生申请新块、擦除新块(非常费时)、数据搬移等等动作,严重地影响了IO性能。
littlefs读写IO性能优化策略
由“2.3 littlefs文件随机读写IO性能瓶颈分析”章节描述可知,影响littlefs文件随机读写IO性能的主要原因是文件只有一个的缓存且被读写复用,造成在读写切换的过程中频繁地发生文件刷新,申请新块,然后执行费时的块擦除,再将CTZ跳表上块内的block内容搬移到新块,进而更新CTZ跳表,这严重影响了随机读写IO的性能。
所以,在RAM空间允许的情况下,可以考虑“使用空间换时间”的策略,适当地增加文件缓存的数量,使一个文件拥有多个缓冲区,而这些缓冲区对应着一个Block的大小,在一定的条件下一次刷新一个Block,从而避免过多的数据搬移。另外,littlefs的策略是“使用时间换空间”,但是每个文件都拥有一个缓冲区明显浪费空间。因为在一段时间内,只会有一定数量的文件被执行读或者写,所以可以考虑建立一个拥有一定数量的缓存池,使缓存在文件间共享。
图6 littlefs优化策略
优化的策略如图6所示,littlefs文件缓存池为一个双向链表fc_pool,缓存池随着被打开文件的个数的增长而延长,直到用户设置的最大限制;缓存池随着文件的关闭而逐渐缩减。
每个缓存挂载在fc_pool缓存池双向链表上,当缓存被写或者被读时,则将缓存移到链表开头,那么缓存池链表末尾的缓存则为待老化的缓存,可以优先被选择回收。
在申请缓存时,优先从缓冲池链表末尾选择空闲缓存;若无空闲缓存,则考虑抢占读缓存;若缓存池既没有空闲缓存也没有读缓存,在缓存池长度没有达到优化限制的情况下,则创建新缓存,然后将新缓冲添加到链表头;若缓存池既没有空闲缓存也没有读缓存,并且缓存池长度已经达到用户限制,那么就需要从链表末尾抢占一个写缓存,并强制占有该缓存的文件执行刷新,进而完成抢占。
在文件被关闭或者刷新时,主动释放缓存到缓存池,挂载在双向链表的末尾。
使用上述策略对文件缓存进行优化,可以在一定程度上减少因更新文件内容而执行的存储器块擦除动作,从而增加随机读写的IO性能,也间接地延长了NorFlash的寿命。
总结
通过本文的讲解,相信大家对于littlefs文件系统有了较为全面的了解。总的来说,littlefs是一种极简的文件系统,实现了文件系统基本的数据缓存、掉电恢复、磨损均衡等功能,在资源相对富裕的环境中,开发者们可以对其运行机制甚至存储结构进行“使用空间换时间”的优化策略,提升读写的IO性能。学会有效地利用文件系统往往能起到事半功倍的作用,希望开发者能够将所学知识有效应用到未来的开发工作中,从而提高开发工作的效率。
OpenHarmony littlefs文件系统存储结构与IO性能优化分析的更多相关文章
- 性能调优之访问日志IO性能优化
性能调优之访问日志IO性能优化 poptest是国内唯一一家培养测试开发工程师的培训机构,以学员能胜任自动化测试,性能测试,测试工具开发等工作为目标.如果对课程感兴趣,请大家咨询qq:908821 ...
- SQL SERVER 查询性能优化——分析事务与锁(五)
SQL SERVER 查询性能优化——分析事务与锁(一) SQL SERVER 查询性能优化——分析事务与锁(二) SQL SERVER 查询性能优化——分析事务与锁(三) 上接SQL SERVER ...
- 一次 group by + order by 性能优化分析
一次 group by + order by 性能优化分析 最近通过一个日志表做排行的时候发现特别卡,最后问题得到了解决,梳理一些索引和MySQL执行过程的经验,但是最后还是有5个谜题没解开,希望大家 ...
- golang 性能优化分析:benchmark 结合 pprof
前面 2 篇 golang 性能优化分析系列文章: golang 性能优化分析工具 pprof (上) golang 性能优化分析工具 pprof (下) 一.基准测试 benchmark 简介 在 ...
- ubifs性能优化分析
本文通过分析ubifs的mount.read.write和commit流程,挖掘ubifs背后的设计决策和性能优化手段,并结合自身产品的特点,给出一些读写性能改进方案. 1. ubifs ...
- Linux 文件系统IO性能优化【转】
转自:https://blog.csdn.net/doitsjz/article/details/50837569 对于LINUX SA来说,服务器性能是需要我们特别关注的,包括CPU.IO.内存等等 ...
- Linux 文件系统IO性能优化
对于LINUX SA来说,服务器性能是需要我们特别关注的,包括CPU.IO.内存等等系统的优化变得至关重要,这里转载一篇非常不错的关于IO优化的文章,供大家参考和学习: 一.关于页面缓存的信息,可以用 ...
- MySQL数据库在IO性能优化方面的设置选择(硬件)
提起MySQL数据库在硬件方面的优化无非是CPU.内存和IO.下面我们着重梳理一下关于磁盘I/O方面的优化. 1.磁盘冗余阵列RAID RAID(Redundant Array of Inexpens ...
- 访问日志IO性能优化
在高并发量的场景下磁盘IO往往是性能的瓶颈所在,访问日志涉及到频繁的写操作,所以这部分要尽可能地优化,不然将拖累系统的整体性能.针对文件记录及数据库记录两种方式可以有以下措施提高写性能, l 避免频繁 ...
- 磁盘IO性能优化-实践
RAID卡缓存策略调整 原因详解 操作实例 I/O 调度算法 文件系统journal 磁盘挂载参数 操作实例 性能数据对比 RAID卡缓存策略调整 可以将RAID卡缓存策略由No Write Cach ...
随机推荐
- mysql进阶语句优化---day40
# ###part1: sql语句优化 #(1) mysql 执行流程 客户端: 发送连接请求,然后发送增删改查sql语句进行执行 服务端: 1.连接层:提供和客户端连接的服务,在tcp协议下 提供多 ...
- 【八股cover#1】MySQL Q&A与知识点
MySQL Q&A与知识点 1.基础知识 什么是主键? 它用来唯一标识一条记录(一个字段).每个表都必须有且只能有一个主键,主键的取值不允许为空,而且在表中必须是唯一的(当然还可以有复合主键) ...
- C++ //谓词 //一元谓词 //概念:返回bool类型的仿函数称为 谓词 //如果 operator()接受一个参数,那么叫做一元谓词 //如果 operator()接受 2 个参数,那么叫做一元谓词
1 //谓词 2 //一元谓词 3 //概念:返回bool类型的仿函数称为 谓词 4 //如果 operator()接受一个参数,那么叫做一元谓词 5 //如果 operator()接受 2 个参数, ...
- Java 辨析之实例化和初始化
在面向对象编程中,实例化和初始化是两个相关但不同的概念: 实例化(Instantiation): 实例化是指创建一个类的新的具体对象的过程.当程序运行时,通过 new 关键字调用类的构造函数来创建该类 ...
- Python列表转换成字典、嵌套列表转字典、多个列表转为字典嵌套列表
目录 两列表转为字典 多列表转为字典嵌套列表 嵌套列表转字典 方法一:直接内置dict 方法二: for循环 一个列表转字典 两列表转为字典 list1=["key1"," ...
- yarn install --offline 离线安装 回头试试 npm install ./package.tgz
yarn install --offline npm pack npm install ./package.tgz 尝试了 npm-pack-all --dev-deps 也不行,太慢,等了20分钟 ...
- [好文推荐] vue3 源码分析 mini-vue 写的不错
[阮一峰推荐]学习 vue3 源码的利器 git clone https://github.com/cuixiaorui/mini-vue.git
- Android webview只加载10%且出现白屏问题排查解决
原文:Android webview只加载10%且出现白屏问题排查解决 - Stars-One的杂货小窝 问题 有一个主页面,布局里是包含的一个自定义Webview,并且注入了些原生的方法进去,供原生 ...
- KTL 一个支持C++14编辑公式的K线技术工具平台
K,K线,Candle蜡烛图. T,技术分析,工具平台 L,公式Language语言使用c++14,Lite小巧简易. 项目仓库:https://github.com/bbqz007/KTL 国内仓库 ...
- C++ 萃取机 Iterator Traits
Iterator Traits 萃取出 Iterator 的性质:迭代器种类.迭代器所指数据类型.迭代器距离类型.迭代器所指数据引用.迭代器所指数据指针.根据不同的迭代器种类可以采取不同的算法策略.但 ...