UNIX环境高级编程之第3章:文件I/O
3.1 引言
文件I/O函数:打开文件,读文件,写文件
经常使用到五个函数:open, read, write, lseek, close.
本章描写叙述的函数都是:不带缓冲的I/O(unbuffered I/O)。属于不带缓冲 是指每一个read和write都是调用内核中一个系统调用
3.2 文件描写叙述符
对于内核而言,全部打开的文件都是通过文件描写叙述符引用的
当读或写一个文件的时候,使用open或creat返回的文件描写叙述符标示该文件,将其參数传给read或write
通常文件描写叙述符0与标准输入关联,1与标准输出关联,2与标准错误关联,用STDIN_FILENO, STDOUT_FILENO, STDERR_FILENO来提高可读性
3.3 函数open和openat
open和openat函数返回的文件描写叙述符一定是最小未用的文件描写叙述符
使用open或者openat创建或者打开一个文件
#include<fcntl.h>
int open(const char *path, int oflag, .../*mode_t mode*/);
int openat(int fd, const char *path, int oflag, .../*mode_t mode*/)
oflag參数能够用来说明此函数的多个选项,用下列一个或多个常量进行"或"运算构成oflag參数
O_RDONLY 仅仅读打开
O_WRONLY 仅仅写打开
O_RDWR 读写打开 通常分别为0,1,2
O_EXEC 仅仅运行打开
O_SEARCH 仅仅搜索打开(应用与文件夹)
还有好多在APUE P50
fd參数把open和openat函数去分开
(1) path參数指绝对路径,fd 能够被忽略open=openat
(2) path指相对路径,fd參数指出了相对路径名在文件系统中的起始地址.fd參数是通过打开相对路径文件名称所在的文件文件夹获取的
(3) path指相对路径。fd參数具有特殊值AT_FDCWD, 这样的情况下路径名再当前文件夹下获得
openat函数希望解决两个问题:
(1) 让线程能够使用相对路径名打开文件夹中的文件。而不是仅仅能打开当前工作文件夹
(2) 避免time-of-check-to-time-of-use(TOCTTOU)错误:该错误的基本思想是假设两个基于文件的函数调用,当中第二个调用依赖第一个调用的结果那么程序是脆弱的。由于一旦文件有变化,第二个调用的结构可能就不正确了
文件名称与路径名截断
假设NAME_MAX是14。而存在的文件名称恰好是14个字符的文件,那么以路径名作为參数的随意函数讲无法知道文件的原始名是什么.其原因是这些函数无法推断函数是否被拦截过
现代文件系统支持文件名称长度能够为255,因此对于绝大多数应用程序没有出过这种问题
3.4 函数creat
能够使用creat创建一个新的文件
#include<fcntl.h>
int creat(const char *path, mode_t mode);
此函数等效于
open(path, O_ERONLY|O_CREAT|O_TRUNC, mode);
O_CREAT:此函数不存在的时候创建它
O_TRUNC:假设次文件存在,并且为仅仅写或者读写成功打开,则将其长度截断为0
早期的UNIX系统版本号中,open的第二个參数仅仅能为0,1,2.无法打开一个尚未存在的文件。因此须要系统调用creat来创建一个文件
creat的一个不足之处是它仅仅能以仅仅写的方式创建文件.在提供open的新版本号之前,假设想创建一个暂时文件。然后再读这个暂时文件,必须先调用creat,close然后再调用open,如今能够直接调用
open(path, O_RDWR|O_CREAT|O_TRUNC, mode);
这样用open能够直接创建一个能够读写的文件
3.5 函数close
能够调用close函数关闭文件
#include<unistd.h>
int close(int fd);
关闭一个文件时还会释放该进程加再该文件上的全部记录锁
当一个进程关闭时,内核将自己主动关闭进程全部打开的文件。非常多程序都利用了这一功能而不显示的关闭文件
3.6 函数lseek
每一个打开文件都有一个与其相关联的"当前文件偏移量"(current file offset)。用来度量从文件開始初的字节数
通常读写操作都是从当前文件偏移量处開始
按系统默认的情况,当打开一个文件的时候,除非制定O_APPEND选项,否则文件偏移量处被设置为零
能够调用lseek显示地为一个打开文件设置文件偏移量
#include<unistd.h>
off_t lseek(int fd, off_t offset, int whence);
对參数offset的解释与參数whence的值有关,若运行成功返回新的文件偏移量,出错返回-1说明该文件不能设置偏移量
(1) whence 是SEEK_SET,将文件的偏移量设置为距文件開始处offset
(2) whence 是SEEK_CUP,将文件的偏移量设置为当前值加offset
(3) whence是SEEK_END,讲文件的偏移量设置为文件长度加上offset, offset可为正可为负
某些设备是同意偏移量为负数的,所以比較lseek返回值的时候必须
<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">要慎重,不要測试是否小于0,而是是否等于-1</span>
lseek仅将当前的文件偏移量记录在内核中,它并不引起不论什么的I/O操作.偏移量用于下一个读写操作
文件偏移量能够大于文件长度形成空洞,空洞不占用存储区
3.7 函数read
调用read函数从打开文件里读取数据
#include <unistd.h>
ssize_t read(int fd, void *buf,size_t nbytes);
带符号整数(ssize_t) 不带符号型整数(sszie)
3.8 函数write
用write函数向打开的文件写数据
#include<unistd.h>
ssize_t write(int fd, const void *buf, size_t nbytes);
3.9 I/O的效率
系统cpu的最小值几乎相同出现再BUFFSIZE为4096及以后的位置。继续添加缓冲区长度对此事件差点儿没有影响
系统cpu时间:系统调用内核接口所用的时间
用户cpu时间:执行用户代码所用的时间比如for循环
时钟时间:执行总时间包含cpu等待时间
大多数文件系统为了改善性能都採用某种预读(read ahead)的技术,预读的效果能够从图中看出,缓冲区长度再32字节以后的时钟时间(Clock time) 与拥有较大缓冲区长度的时钟时间差点儿是一样的
3.10 文件共享
内核使用3中数据结构标示打开的文件
(1)每一个进程在进程表中都有一个纪录项(entry)
a.文件描写叙述符标志(file descriptor flag)
b.指向文件表项的指针(pointer to file table entry)
(2)内核为全部打开的文件维护一张文件表
a.文件状态标志(the file status flag)(读,写,添写。同步和非堵塞)
b.当前文件偏移量(the current file offset)
c.指向该文件v节点表项的指针(the pointer to v-node table entry)
(3)每一个打开文件都有一个v节点结构。v节点包括了文件类型以及对文件进行各种操作的指针还有文件的I节点(文件的全部者,文件长度指向文件实际数据块再磁盘所在的位置)
这些信息都是打开文件之后,从磁盘读入内存的
两个进程共享一个文件
假设两个独立的进程各自打开同一个文件
两个进程都打开了该文件,获得各自的文件表项由于每一个进程有自己的file offset,但每一个给定的文件仅仅有一个v-node表项
Notice: 文件描写叙述符标志(file descriptor flag)和文件状态标志(file status flag),文件描写叙述符是对一个进程的文件描写叙述符。后者是指向该文件表项(file entry)的不论什么进程的全部描写叙述符
3.11 原子操作
3.12 函数dup和dup2
#include<unistd.h>
int dup(int fd);
int dup(int fd, int fd2);
dup返回的新的file descriptor一定是当前可用文件描写叙述符最小数值
3.13 函数sync, fsync,和fdatasync
这样的方法叫做延迟写(delayed write)
#include<unisted.h>
int fsync(int fd);
int fdatasync(int fd);
void sync(void);
sync是将全部改动过的块缓冲区排入写队列,通常成为updata的系统守护进程周期性地调用sync函数,这就完毕了定期冲洗(flush)内核的块缓冲区
3.14 函数fcntl
#include<fcntl.h>
int fcntl(int fd, int cmd, ....);
p65 介绍cmd
3.15 小结
习题
UNIX环境高级编程之第3章:文件I/O的更多相关文章
- UNIX环境高级编程之第4章:文件和文件夹-习题
4.1 stat函数是尾随符号链接的,所以用stat替换lstat不会显示符号链接的信息 4.2 在一个目录下先再shell中输入umask shell进程再进行创建文件的操作.其权限抖都会被屏蔽 4 ...
- (四) 一起学 Unix 环境高级编程(APUE) 之 系统数据文件和信息
. . . . . 目录 (一) 一起学 Unix 环境高级编程 (APUE) 之 标准IO (二) 一起学 Unix 环境高级编程 (APUE) 之 文件 IO (三) 一起学 Unix 环境高级编 ...
- 《UNIX环境高级编程》第七章进程环境
7.2 main函数 1.C程序总是从main函数开始执行的,原型:int main(int argc,char *argv[]);argc是命令行参数的个数argc是指向参数的各个指针所构成的数组2 ...
- UNIX环境高级编程(5):文件I/O(1)
UNIX系统中的大多数文件I/O仅仅须要用到5个函数:open.read.write.lseek以及close.本章说明的函数常常称为"不带缓冲的I/0",术语不带缓冲指的是每一个 ...
- 《UNIX环境高级编程》学习心得 四 文件I/O(一)
这里说的文件I/O是相对标准I/O来说的.主要介绍在UNIX系统中常用的五个文件I/O函数:open.read.write.lseek.以及close. 一.open和opennat #include ...
- UNIX环境高级编程(6):文件I/O(2)
文件共享: UNIX系统支持在不同进程间共享打开的文件. 内核使用三种数据结构表示打开的文件.他们之间的关系决定了在文件共享方面一个进程对还有一个进程可能产生的影响: (1)每一个进程在进程表中都有一 ...
- (十三) [终篇] 一起学 Unix 环境高级编程 (APUE) 之 网络 IPC:套接字
. . . . . 目录 (一) 一起学 Unix 环境高级编程 (APUE) 之 标准IO (二) 一起学 Unix 环境高级编程 (APUE) 之 文件 IO (三) 一起学 Unix 环境高级编 ...
- (一) 一起学 Unix 环境高级编程 (APUE) 之 标准IO
. . . . . 目录 (一) 一起学 Unix 环境高级编程 (APUE) 之 标准IO (二) 一起学 Unix 环境高级编程 (APUE) 之 文件 IO (三) 一起学 Unix 环境高级编 ...
- (五) 一起学 Unix 环境高级编程 (APUE) 之 进程环境
. . . . . 目录 (一) 一起学 Unix 环境高级编程 (APUE) 之 标准IO (二) 一起学 Unix 环境高级编程 (APUE) 之 文件 IO (三) 一起学 Unix 环境高级编 ...
随机推荐
- Oracle 递归的写法(start with) 以及where条件作用域
先转一个讲Oracle递归讲得非常透彻的文章: http://blog.csdn.net/weiwenhp/article/details/8218091 前言:嗯,这也是一个前人挖坑,后人来填的故事 ...
- Less文件的建立
1.打开DreamWeaver 2.选择 新建 Less 文件名为.less,保存于Less文件夹中 3.声明文档头:@charset "utf-8"; 4.将Less ...
- win32之bitmap篇
先讲一下LoadBitmap的用法,代码如下: PAINTSTRUCT ps; HDC hdc = BeginPaint(hwnd,&ps); HDC hMemDC = CreateCompa ...
- Linux学习(一)--基本概念
一.Linux概述 Linux是一款全球性的免费的开源的操作系统平台,其特点是实现了多任务多用户处理,主要是依赖内核kernel shell,且占用资源少 (最小配置只要4Mb内存就能运行). 百度百 ...
- html5——多媒体(三)
自定义进度条 1.video标签是内联块,可以设置宽高,但是需要用大盒子将其包裹起来进行定位 2.小盒子设计成进度条样式,并进行定位 3.进度条样式中的特殊按钮可以用web字体 4.通过点击实现视频的 ...
- C#——计时器的操作
我们可以用Stopwatch类获得程序的运行时间,在优化代码时,可以用此方法来查看优化前后程序所耗费的时间 static void Main(string[] args) { Stopwatch sw ...
- [Windows Server 2003] IIS自带FTP安装及配置方法
★ 欢迎来到[护卫神·V课堂],网站地址:http://v.huweishen.com★ 护卫神·V课堂 是护卫神旗下专业提供服务器教学视频的网站,每周更新视频.★ 本节我们将带领大家:IIS6.0自 ...
- 【译】x86程序员手册14-5.1段转换
5.1 Segment Translation 段转换 Figure 5-2 shows in more detail how the processor converts a logical add ...
- 神经网络图灵机(Neural Turing Machines, NTM)
近期,Google Deep Mind团队提出了一个机器学习模型,并起了一个特别高大上的名字:神经网络图灵机,我为大家翻译了这篇文章,翻译得不是特别好,有些语句没读明白,欢迎大家批评指正 原论文出处 ...
- day2笔记
今日内容: 1.常用数据类型即数据方法 2.文件处理 3.函数 一 列表: 在[]内,可以存放多个任意类型的值,并以逗号隔开. 一般用于存放学生的爱好,课堂的周期等等 优先掌握的操作: 1.按索引取值 ...