1s 创建100G文件,最快的方法是?
在我们日常工作中,为了验证开发的功能,比如:文件上传功能或者算法的处理效率等,经常需要一些大文件进行测试,有时在四处找了一顿之后,发现竟然没有一个合适的,虽然 Linux 中也有一些命令比如:vim、touch
等可以创建文件,但是如果需要一个 100G 或者 1T 的大文件,这些命令就显得力不从心,此时就需要能快速创建大文件命令,接下来将介绍这些命令的常见用法、命令之间的差异、以及使用时如何选择
dd
dd
命令的语法如下
dd if=[source] of=[destination] bs=[block-size] count=[counter]
从 source
读取并拷贝内容到 destination
, source
和 destination
都是文件,前者是读取的文件,后者是写入的文件
bs
表示块的大小,单位是字节,后缀中带了字母 B
的换算单位都是 1000
, 比如: 1KB = 1000 Bytes
、 1MB = 1000 * 1000 Bytes
、 1GB = 1000 * 1000 * 1000 Bytes
后缀省略了字母 B
的换算单位是 1024
, 比如: 1K = 1024 Bytes
、 1M = 1024 * 1024 Bytes
、 1G = 1024 * 1024 * 1024 Bytes
count
表示块的数量,表示 dd
命令需要执行多少次读取并写入的操作
bs
乘以 count
其实就表示目标文件的大小,也即需要创建的文件的大小,比如:下面的命令可以创建一个 10G 大小的文件
[root@localhost dd_cmd]# dd if=/dev/zero of=testfile bs=1G count=10
记录了10+0 的读入
记录了10+0 的写出
10737418240字节(11 GB)已复制,8.61643 秒,1.2 GB/秒
[root@localhost dd_cmd]# du -h testfile
10G testfile
[root@localhost dd_cmd]#
上面的命令表示从 /dev/zero
文件每次读取 1G
大小的数据并写入当前目录中的 testfile
文件, bs=1G count=10 表示块大小是1G
,总共有10个块, 所以目标文件最终的大小是: 1G * 10 = 10G
/dev/zero
是一个特殊的字符设备文件,当读取它的时候,它会返回空数据,这里表示从 /dev/zero
读取空的数据写入 testfile
中
命令 du -h testfile
的结果也说明了 testfile
大小是 10G
从结果可以得知,用 dd
命令创建一个 10G
大小的文件花费了约 8.6 秒
yes
前面的 dd
命令创建的是空字符的文件,如果想文件中包含自定义的字符,可以使用 yes
命令,它的作用是循环输出一行指定的字符串,直到进程结束,为了控制文件的大小并打破循环,我们借助 head
命令来实现,使用 yes
命令创建包含指定内容文件的语法如下
yes [string] | head -c [size of file] > [name of file]
string
是写入文件每一行的字符串
head -c [size of file]
是接收指定大小的字符串,单位是字节,后面也可以接 K
、KB
、M
、MB
、G
、GB
等单位
下面的实例是往 yesfile
文件写入,每行的内容是: this is a test content
, 一直到文件大小达到 10G
[root@localhost dd_cmd]# time yes "this is a test content" | head -c 10G > yesfile
real 0m11.266s
user 0m8.898s
sys 0m13.217s
[root@localhost dd_cmd]# du -h yesfile
10G yesfile
从结果可以看出,yes
命令创建一个 10G
的文件花费了 13.2 秒,比 dd
命令慢
fallocate
fallocate
命令使用下面的语法 创建大文件
fallocate -l [size of file] [name of file]
-l
选项表示文件大小,单位是字节,后面可以接 K
、KB
、M
、MB
、G
、GB
等单位
下面的命令是创建一个 10G
大小的文件
[root@localhost dd_cmd]# time fallocate -l 10G allocatefile
real 0m0.002s
user 0m0.000s
sys 0m0.003s
[root@localhost dd_cmd]# du -h allocatefile
10G allocatefile
上述的 time
命令只是为了统计创建文件的时间,从结果可以看出:fallocate
命令创建一个 10G
大小的文件竟然只花费了 0.003 秒
命令 du -h allocatefile
是查看创建的文件大小,从结果可知,allocatefile
文件大小确实是 10G
truncate
truncate
命令是缩小或者扩展文件至指定大小,它的语法如下:
truncate -s [file-size] [name of the file]
-s
选项表示文件大小,单位是字节,跟 fallocate
命令一样,后面可以接 K
、KB
、M
、MB
、G
、GB
等单位
下面是使用 truncate
命令创建一个 10G
的文件的示例
[root@localhost dd_cmd]# time truncate -s 10G truncatefile
real 0m0.002s
user 0m0.000s
sys 0m0.002s
[root@localhost dd_cmd]# du -h truncatefile
0 truncatefile
从结果可以得到,truncate
命令 创建一个 10G
的文件也只花费了 0.002 秒,和 fallocate
差不多
但是, du -h truncatefile
命令的结果表明 truncatefile
大小为 0
原因是 truncate 命令 创建的是一个稀疏文件而不是实际的文件 ,稀疏文件不会占用磁盘空间
注意:fallocate
命令只支持 btrfs、ext4、 ocfs2、xfs
这几种文件系统,而 truncate
命令支持所有的现代文件系统
创建速度的差异
从上面的几个实例可以看出,同样是创建一个 10G
的文件, fallocate
和 truncate
命令只需要不到 0.1 秒的时间,但是 dd
命令需要 8.6 秒的时间,yes
命令需要 13.2 秒,这中间相差了几百倍,为什么会有这么大的差别呢?
fallocate
将空间分配给文件,但是不会往文件中写入任何数据
truncate
创建的是稀疏文件,和 fallocate
一样,它也不会往文件中写入任何数据
dd
和 yes
都有写文件操作,而这需要大量的 IO 时间,所以同样创建 10G
的文件,它们比 fallocate
和 truncate
要慢很多
如何选择
dd
、yes
、fallocate
、truncate
这几个命令都可以创建大文件, 在日常的使用中,我们该如何选择呢 ?
对速度没有很高的要求的情况下,一般首选 dd
,如果希望创建的文件中写入自定义的内容的话,使用 yes
如果想快速的创建大文件,比如 1 秒内创建一个 100G 的文件,选择 fallocate
和 truncate
,如果还需要确保文件是实际占用磁盘空间的话,就只剩下 fallocate
可选了
大部分情况下,fallocate
都能满足要求,所以不想仔细分析的话,使用 fallocate
就行了
小结
本文介绍了Linux下创建大文件的几种方法,并对所提供的方法进行了比较,最后提供了如何选择使用哪种方法的一些建议,文中只对 dd
、yes
、fallocate
、truncate
命令做了简要的说明,更多的介绍请参考 man
文档
1s 创建100G文件,最快的方法是?的更多相关文章
- .net中创建xml文件的两种方法
.net中创建xml文件的两种方法 方法1:根据xml结构一步一步构建xml文档,保存文件(动态方式) 方法2:直接加载xml结构,保存文件(固定方式) 方法1:动态创建xml文档 根据传递的值,构建 ...
- C# 创建Dll文件供程序调用方法
C# 创建Dll文件供程序调用方法 使用C#创建动态Dll文件方法: 1. 在VS2017环境下,新建-项目-选择类库类型: 2. 新创建一个.cs文件(如test.cs),编写代码如下: usin ...
- ubuntu/linux mint 创建proc文件的三种方法(四)
在做内核驱动开发的时候,能够使用/proc下的文件,获取对应的信息,以便调试. 大多数/proc下的文件是仅仅读的,但为了演示样例的完整性,都提供了写方法. 方法一:使用create_proc_ent ...
- ubuntu/linux mint 创建proc文件的三种方法(两)
在这样做的内核驱动程序的开发时间.可以使用/proc下档.获取相应的信息.对于调试. 大多数/proc下的文件是仅仅读的.但为了演示样例的完整性.都提供了写方法. 方法一:使用create_proc_ ...
- Windows下自由创建.htaccess文件的N种方法
.htaccess是apache的访问控制文件,apache中httpd.conf的选项配合此文件,完美实现了目录.站点的访问控 制,当然最多的还是rewrite功能,即URL重写,PHP中实现伪静态 ...
- c++中读取文件最快的方法
https://www.byvoid.com/blog/fast-readfile 可以看看了.
- [转].net创建XML文件的两种方法
原文发布时间为:2009-08-26 -- 来源于本人的百度文章 [由搬家工具导入] 方法一:按照XML的结构一步一步的构建XML文档. 通过.Net FrameWork SDK中的命名空间&q ...
- Java: 复制文件最快方法
利用Java复制文件到处都可以用到,这里总结了一个类供大家参考.里面总共有两个方法: public static boolean copyFile(String srcFileName, String ...
- asp.net创建XML文件方法
方法一:按照XML的结构一步一步的构建XML文档. 通过.Net FrameWork SDK中的命名空间"System.Xml"中封装的各种类来实现的 方法一:按照XML的结 ...
随机推荐
- Java工具之Myeclipse程序调试
步骤1: 分析错误,设置断点 步骤2: 启动调试 步骤3: 单步运行 (1)调试启动后,运行到设置断点的代码行将停住 (2)点击F6键可以单步运行程序,观察程序运行过程. (3)使用F5进入方法中进行 ...
- Spring Boot 进行优雅的字段校验
Controller层 VS Service层 一般推荐与业务无关的放在Controller层中进行校验,而与业务有关的放在Service层中进行校验. 那么如何将参数校验写的优雅美观呢,如果都是if ...
- java-计算机
计算机 硬件 装机:CPU 内存 主板 IO设备(input output) 冯诺依曼体系结构 CPU读取数据在运算器中运算传输到存储器,控制器控制输出结果. 软件
- [环境部署] Windows Server 2016 配置指南 之 安装 Redis3.0
Redis是一个开源的高级key-value(键-值)缓存与存储,以高性能著称.用于做对象缓存,可以获得极佳的性能体验,可是 Redis 的官方开发团队并没有开发针对 Windows 的版本,不过还好 ...
- tomcat启动 ssm项目出现乱码的解决
0.乱码产生原因:编码和解码的方式是不同 1.出现乱码的解决方式[推荐]: 在tomcat 的配置文件web.xml 中添加上请求编码过滤器: <!-- 请求编码过滤器 --> <f ...
- bzoj3926/luoguP3346 [Zjoi2015]诸神眷顾的幻想乡(trie上构建广义后缀自动机)
bzoj3926/luoguP3346 [Zjoi2015]诸神眷顾的幻想乡(trie上构建广义后缀自动机) bzoj Luogu 题解时间 给你个无根trie树(你管这叫trie树?),问你选取一条 ...
- KestrelServer详解[3]: 自定义一个迷你版的KestrelServer
和所有的服务器一样,KestrelServer最终需要解决的是网络传输的问题.在<网络连接的创建>,我们介绍了KestrelServer如何利用连接接听器的建立网络连接,并再次基础上演示了 ...
- 面试之Java String 编码相关
实话说,作为一个多年Java老年程序员,直到近来,在没有决心花时间搞清楚Java String的编码相关问题之前, 自己也都还是似懂非懂,一脸懵逼的.设想如果在面试中,有同学能够条理清晰的回答下面的问 ...
- SpringBoot 上传文件大小限制,SizeLimitExceededException: the request was rejected because its size (64042302) exceeds the configured maximum (10485760)
对应的配置属性文件:org.springframework.boot.autoconfigure.web.servlet.MultipartProperties 由于我是yml文件,所以直接这样定义就 ...
- 学习openstack(八)
一.OpenStack初探 1.1 OpenStack简介 OpenStack是一整套开源软件项目的综合,它允许企业或服务提供者建立.运行自己的云计算和存储设施.Rackspace与NASA是最初 ...