《Unix环境高级编程》读书笔记 第5章-标准I/O流
1. 引言
- 标准I/O库由ISO C标准说明,由各个操作系统实现
- 标准I/O库处理很多细节,如缓冲区分配、以优化的块长度执行I/O等。这些处理使用户不必担心如何使用正确的块长度,这使得它便于用于使用,但是如果不深入地了解I/O库函数的操作,也会带来一些问题。
2. 流和FILE对象
- 第3章中,所有I/O函数都是围绕文件描述符的;对于标准I/O库,它们的操作是围绕流
FILE *
进行的,称其为文件指针
。 FILE对象通常是一个结构,它包括了标准I/O库为管理该流需要的所有信息,包括用于实际I/O的文件描述符、指向用于该流缓冲区的指针、缓冲区的长度、当前在缓冲区中的字符数以及出错标志等。
标准I/O文件流可用于单字节或多字节(“宽”)字符集。
- 流的定向决定了所读、写的字符是单字节还是多字节的。当一个流最初被创建时,它并没有定向。若在为定向的流上使用一个多字节I/O函数,则将流的定向设置为
宽定向
的;若在为定向的流上使用一个单字节I/O函数,则将流的定向设置为字节定向
的。
#include <stdio.h>
#include <wchar.h>
int fwide(FILE *fp, int mode);
if stream has no orientation
- 根据mode参数的不同字,fwide函数执行不同的工作。
- mode为负,则字节定向;
- mode为正,则宽定向;
- mode为0,则不设置流的定向,fwide返回标识该流定向的值
- 注意,fwide并不改变已定向流的定向
3. 标准输入、标准输出、标准错误
- 3个标准I/O流通过预定义文件指针(即FILE *) stdin、stdout、stderr加以引用。
4. 缓冲
标准I/O库提供缓冲的目的是尽可能减少使用read和write调用的次数。它对每个I/O流自动地进行缓冲管理,从而避免了应用程序需要考虑这一点所带来的麻烦。遗憾的是,标准I/O库最令人迷惑的也是它的缓冲。
标准I/O提供了以下3种类型的缓冲:
- 全缓冲。在填满标准I/O缓冲区后才进行实际I/O操作。对于驻留在磁盘上的文件通常由标准I/O库实施全缓冲。缓冲区可由标准I/O例程自动地冲洗(flush),也可通过调用函数fflush冲洗一个流。
- 术语flush有两种意思:在标准I/O库方面,flush(冲洗)意味着缓冲区中的内容写到磁盘上;在终端驱动程序方面,flush(刷清)表示丢弃已存储在缓冲区中的数据。
- 行缓冲。当输入或输出中遇到换行符时,标准I/O库执行I/O操作。当流涉及一个终端时,通常使用行缓冲。
- 对于行缓冲有两个限制:
- 只要填满了缓冲区,即使还没遇到换行符,也进行I/O操作;
- 任何时候只要通过标准I/O库要求从(a)
一个
不带缓冲的流,或者(b)一个
行缓冲的流得到输入数据,那么就会flush所有
行缓冲输出流。
- 对于行缓冲有两个限制:
- 不带缓冲。标准I/O库不对字符进行缓冲存储。如fputs函数。标准错误流stderr通常是不带缓冲的。
- 全缓冲。在填满标准I/O缓冲区后才进行实际I/O操作。对于驻留在磁盘上的文件通常由标准I/O库实施全缓冲。缓冲区可由标准I/O例程自动地冲洗(flush),也可通过调用函数fflush冲洗一个流。
ISO C要求下列缓冲特征:
- 当且仅当标准输入和标准输出并不指向交互式设备时,它们才是全缓冲的
- 标准错误决不会是全缓冲的
很多系统默认使用下列类型的缓冲:
- 标准错误是不带缓冲的
- 若是指向终端设备的流,则是行缓冲的;否则是全缓冲的
#include <stdio.h>
void setbuf(FILE *restrict fp, char *restrict buf );
// 使用该函数打开或关闭缓冲机制。参数buf必须指向一个长度为BUFSIZ的缓冲区;或为NULL以关闭缓冲
int setvbuf(FILE *restrict fp, char *restrict buf, int mode, size_t size);
if OK, nonzero on error
- 上面两个函数必须在流被打开后,且对流执行任何一个其他操作之前调用
- mode参数:_IOFBF全缓冲、_IOLBF行缓冲、_IONBF不带缓冲
- 如果指定全缓冲或行缓冲,则buf和size可选择地指定一个缓冲区及其长度。若流带缓冲而buf是NULL,则标准I/O库将自动地为该流分配适当长度的缓冲区。
#include <stdio.h>
int fflush(FILE *fp); // 若fp为NULL,则导致所有输出流被冲洗
if OK, EOF on error
5. 打开流
- 下列3个函数打开一个标准I/O流
#include <stdio.h>
FILE *fopen(const char *restrict pathname, const char *restrict type);
FILE *freopen(const char *restrict pathname, const char *restrict type, FILE *restrict fp);
// 在一个指定的流上打开一个指定的文件,如若该流已经打开,则先关闭该流
FILE *fdopen(int fd, const char *type); // 取一个已有的文件描述符,并使一个标准的I/O流与该描述符相结合
All three return: file pointer if OK, NULL on error
- 打开标准I/O流的type参数
- 字符b,代表二进制。但Unix内核并不对文本文件和二进制文件进行区分
- 注意:在指定w或a类型创建一个新文件时,我们无法说明该文件的访问权限位;而open和creat可以
如果以读和写类型打开一个文件时(type中带+号),具有下列限制:
- 如果中间没有fflush、fseek、fsetpos或rewind,则在输出的后面不能直接跟随输入
- 如果中间没有fseek、fsetpos或rewind,或者一个输入操作没有到达文件尾端,则在输入操作之后不能直接跟随输出
打开一个标准I/O流的6种不同方式
- 除非流引用终端设备,否则按系统默认,流被打开是全缓冲的。若流引用终端设备,则该流是行缓冲的。
#include <stdio.h>
int fclose(FILE *fp);
if OK, EOF on error
- 当一个进程正常终止时(调用exit或从main函数返回),则所有带未写缓冲数据的标准I/O流都被冲洗,所有打开的标准I/O流都被关闭。
6. 读和写流
一旦打开了流,可在
3种
不同类型的非格式化I/O中进行选择,对其进行读、写操作- 每次一个字符的I/O
- 每次一行的I/O
- 直接I/O(二进制I/O、面向记录的I/O、一次一个对象的I/O)
在大多数实现中,为每个流在FILE对象中维护了两个标志:
- 出错标志
- 文件结束标志
区分是出错还是到达文件尾端,因为这两种情况下返回值相同
#include <stdio.h>
int ferror(FILE *fp);
int feof(FILE *fp);
(false) otherwise
void clearerr(FILE *fp); // 调用clearerr可以清除这两个标志
7. 每次一个字符的I/O
- 输入函数
#include <stdio.h>
int getc(FILE *fp); // 可被实现为宏,故参数不应当是具有副作用的表达式;返回值是int,因为常量EOF是-1
int fgetc(FILE *fp); // 一定是个函数
int getchar(void); // getc(stdin)
All three return: next character if OK, EOF on end of file or error
#include <stdio.h>
int ungetc(int c, FILE *fp); // 将字符再压送回流中,可回送多次,但再次读出字符的顺序与压送回的顺序相反。一次一字符
// 作用:有时需要查看下一个字符,以决定对当前字符如何处理
Returns: c if OK, EOF on error
- 输出函数
#include <stdio.h>
int putc(int c, FILE *fp);
int fputc(int c, FILE *fp);
int putchar(int c);
All three return: c if OK, EOF on error
8. 每次一行I/O
#include <stdio.h>
char *fgets(char *restrict buf, int n, FILE *restrict fp); // 存入换行符
char *gets(char *buf ); // 不推荐使用,可能造成缓冲区溢出;并不将换行符存入缓冲区中
Both return: buf if OK, NULL on end of file or error
#include <stdio.h>
int fputs(const char *restrict str, FILE *restrict fp); // 不一定换行
int puts(const char *str); // 必定输出一换行符
Both return: non-negative value if OK, EOF on error
9. 标准I/O的效率
10. 二进制I/O
- 如果进行二进制I/O操作,那么我们更愿意一次读或写一个完整的结构
#include <stdio.h>
size_t fread(void *restrict ptr, size_t size, size_t nobj, FILE *restrict fp);
size_t fwrite(const void *restrict ptr, size_t size, size_t nobj, FILE *restrict fp);
Both return: number of objects read or written
- 两种常见的用法:
- 读或写一个二进制数组
- 读或写一个结构
- fread和fwrite函数返回读或写的对象数。fread可能少于nobj;fwrite若少于nobj则出错。
- 使用二进制I/O的基本问题是:它只能用于读在同一个系统上已写的数据。其原因是:
- 在一个结构中,同一成语的偏移量可能随编译程序和系统的不同而不同。
- 用来存储多字节整数和浮点数的二进制格式在不同的系统结构间也可能不同。
- 在不同系统之间交换二进制数据的实际解决方法是:使用互认的规范格式。
11. 定位流
- 有3种方法定位标准I/O流
- ftell和fseek函数。它们假定文件的位置可以存放在一个长整型中
- ftello和fseeko函数。使用
off_t
数据类型代替long - fgetpos和fsetpos函数。由ISO C引入的。使用一个抽象数据类型
fpos_t
记录文件的位置。需要移植到非Unix系统上运行的应用程序使用fgetpos和fsetpos
#include <stdio.h>
long ftell(FILE *fp);
Returns: current file position indicator if OK, −1L on error
int fseek(FILE *fp, long offset, int whence);
on error
void rewind(FILE *fp);
#include <stdio.h>
off_t ftello(FILE *fp);
on error
int fseeko(FILE *fp, off_t offset, int whence);
on error
#include <stdio.h>
int fgetpos(FILE *restrict fp, fpos_t *restrict pos);
int fsetpos(FILE *fp, const fpos_t *pos);
if OK, nonzero on error
12. 格式化I/O
- 格式化输出
#include <stdio.h>
int printf(const char *restrict format, ...);
int fprintf(FILE *restrict fp, const char *restrict format, ...); // 写到指定的流
int dprintf(int fd, const char *restrict format, ...); // 写到指定的文件描述符
All three return: number of characters output if OK, negative value if output error
int sprintf(char *restrict buf, const char *restrict format, ...);
// 写到数组buf,末尾加null字节,但该字节不包括在返回值中;可能溢出,故不推荐使用它
Returns: number of characters stored in array if OK, negative value if encoding error
int snprintf(char *restrict buf, size_t n, const char *restrict format, ...); // 显式指定了缓冲区长度n
Returns: number of characters that would have been stored in array
- 使用arg替换了可变参数表(...)
#include <stdarg.h>
#include <stdio.h>
int vprintf(const char *restrict format, va_list arg);
int vfprintf(FILE *restrict fp, const char *restrict format, va_list arg);
int vdprintf(int fd, const char *restrict format, va_list arg);
All three return: number of characters output if OK, negative value if output error
int vsprintf(char *restrict buf, const char *restrict format, va_list arg);
Returns: number of characters stored in array if OK, negative value if encoding error
int vsnprintf(char *restrict buf, size_t n, const char *restrict format, va_list arg);
Returns: number of characters that would have been stored in array
- 格式化输入
#include <stdio.h>
int scanf(const char *restrict format, ...);
int fscanf(FILE *restrict fp, const char *restrict format, ...);
int sscanf(const char *restrict buf, const char *restrict format, ...);
All three return: number of input items assigned,
EOF if input error or end of file before any conversion
- 调用fileno函数以获得其描述符
#include <stdio.h>
int fileno(FILE *fp);
Returns: the file descriptor associated with the stream
13. 临时文件
- 创建临时文件
#include <stdio.h>
char *tmpnam(char *ptr);
Returns: pointer to unique pathname
FILE *tmpfile(void);
Returns: file pointer if OK, NULL on error
- tmpnam函数产生一个与现有文件名不同的一个有效路径名字符串。最多调用次数TMP_MAX(stdio.h中定义)
- 若ptr为NULL,则所产生的路径名存放在一个静态区中,指向该静态区的指针作为函数值返回。后续调用tmpnam函数会重写该静态区
- 若ptr不为NULL,则认为它应该是指向长度至少是L_tmpnam(stdio.h中定义)个字符的数组
- tmpfile函数创建一个临时二进制文件(类型wb+),在关闭该文件或程序结束时间自动删除这种文件
#include <stdlib.h>
char *mkdtemp(char *template);
Returns: pointer to directory name if OK, NULL on error
int mkstemp(char *template);
on error
- 名字是通过template字符串进行选择的。这个字符串的后6位设置为
XXXXXX
的路径名。 - mkdtemp创建一个目录,返回新目录的名字,其访问权限位集:S_IRUSR | S_IWUSR | S_IXUSR
- mkstemp创建一个普通文件并以读写方式打开该文件,访问其文件描述符,其访问权限位集:S_IRUSR | S_IWUSR
- mkstemp函数与tmpfile不同,其创建的临时文件不会自动删除
- 使用tmpnam和tempnam(未列出其原型)至少有一个缺点:在返回唯一的路径名和使用该路径名创建文件之间存在一个时间窗口;而tmpfile和mkstemp函数则不会
14. 内存流
- 在SUSv4中支持内存流,内存流是没有底层文件支持,但仍使用FILE指针进行访问的标准I/O流
- 有3个函数可用于内存流的创建,第1个是fmemopen函数,它允许调用者提供缓冲区用于内存流
#include <stdio.h>
FILE *fmemopen(void *restrict buf, size_t size, const char *restrict type);
Returns: stream pointer if OK, NULL on error
- fmemopen函数允许调用者提供缓冲区用于内存流,buf参数指向缓冲区的开始位置,size为缓冲区的字节数
- 当buf为NULL时,函数自动分配size字节的缓冲区,这种情况下,当流关闭时缓冲区会被释放
- type参数控制如何使用流
- type参数的这些取值与基于文件的标准I/O流的type参数有些微小差别,具体参见书中讲解
#include <stdio.h>
FILE *open_memstream(char **bufp, size_t *sizep); // 创建的流是面向字节的
#include <wchar.h>
FILE *open_wmemstream(wchar_t **bufp, size_t *sizep); // 创建的流是面向宽字节的
Both return: stream pointer if OK, NULL on error
- 这两个函数与fmemopen函数的不同在于:
- 创建的流只能写文件
- 不能指定自己的缓冲区,当可以分别通过bufp和sizep参数访问缓冲区地址和大小
- 关闭流后需要自行释放缓冲区
- 对流添加字节会增加缓冲区大小
15. 标准I/O的替代软件
- 快速I/O库 fio
- sfio
- mmap函数
- uClibc C库
- Newlib C库
原创文章,转载请注明出处: http://www.cnblogs.com/DayByDay/p/3893905.html
《Unix环境高级编程》读书笔记 第5章-标准I/O流的更多相关文章
- [置顶] 文件和目录(二)--unix环境高级编程读书笔记
在linux中,文件的相关信息都记录在stat这个结构体中,文件长度是记录在stat的st_size成员中.对于普通文件,其长度可以为0,目录的长度一般为1024的倍数,这与linux文件系统中blo ...
- unix环境高级编程-读书笔记与习题解答-第一篇
从这周开始逐渐的进入学习状态,每天晚上都会坚持写c程序,并且伴随对这本书的深入,希望能写出更高质量的读书笔记和程序. 本书的第一章,介绍了一些关于unix的基础知识,在这里我不想去讨论linux到底是 ...
- unix 环境高级编程-读书笔记与习题解答-第二篇
第四节 输入与输出 上次的笔记中写到的 open, read, write, lseek 以及close ,都是不带缓存的IO函数,这些函数都使用文件描述符进行工作. 上一篇笔记用到的 read(ST ...
- [置顶] 文件io(一)--unix环境高级编程读书笔记
unix-like(后面以linux为例)系统中的文件操作只需要五个函数就足够了,open.close.read.write以及lseek.这些操作被称为不带缓存的io,这里有必要说一下带缓存和不带缓 ...
- unix 环境高级编程 读书笔记与习题解答第四篇
第一章 第六节 第一小节 这一章没有程序设计和API方面的深入学习,而是注重介绍了unix操作系统中的原始数据类型和系统原型函数,错误处理方面的知识. ____unistd.h____ 该文件包含了u ...
- unix进程的环境--unix环境高级编程读书笔记
http://blog.csdn.net/xiaocainiaoshangxiao/article/category/1800937
- unix环境高级编程 读书笔记
1.上班业余时间把书下载下来,第一章读完了,但是程序只能回家运行啦!Fighting!
- Unix环境高级编程学习笔记——fcntl
写这篇文正主要是为了介绍下fcntl,并将我自己在学习过程中的一些理解写下来,不一定那么官方,也有错误,希望指正,共同进步- fcntl: 一个修改一打开文件的性质的函数.基本的格式是 int fcn ...
- 《UNIX环境高级编程》笔记--UNIX标准化及实现
1.UNIX标准化 1.1.ISO C 1989 年后期,C程序设计语言的ANSI(American National Standards Institute) 标准X3. 15 9-1989得到批准 ...
随机推荐
- Windows下Java JDK安装和环境变量配置
[Java攻城狮学习路线](http://www.cnblogs.com/apollospotatolikett/p/8665123.html 1.JDK下载 下载地址:http://www.orac ...
- firstChild与firstElementChild
相同点: 都是获取父元素下的第一个节点对象 不同点: firstChild: IE6.7.8 第一个元素节点; 非IE6.7.8:返回第一个元素节点或文本节点 firstElementChild: I ...
- 七牛上图片总是net::ERR_NAME_NOT_RESOLVED
七牛上图片总是net::ERR_NAME_NOT_RESOLVED >> php这个答案描述的挺清楚的:http://www.goodpm.net/postreply/php/101000 ...
- 这个夏天有你,有CorelDRAW X7,有理想,有设计!
CorelDRAW是加拿大Corel公司出品的一款功能全面的矢量绘图.平面设计软件,兼有图形设计的简易操作性和图像编辑的强大功能.目前,被广泛应用于广告宣传.艺术作品.纺织业等各个行业.和Photos ...
- Python_study_day_1_while_if
1.什么是计算机 cpu:大脑 3GHz 内存:缓冲硬盘和cpu,提高计算机运算速度 硬盘:存储数据 2.编程语言的简单分类 编译型,解释型,混合型 3.python是什么编程语言 解释类语言 //. ...
- is == id 的用法;代码块;深浅copy;集合
1 内容总览 is == id 用法 代码块 同一代码块下的缓存机制 (字符串驻留机制) 不同代码块下的缓存机制 (小数据池) 总结 集合(了解) 深浅copy 2 具体内容 id is == # i ...
- 【Paper Reading】Deep Supervised Hashing for fast Image Retrieval
what has been done: This paper proposed a novel Deep Supervised Hashing method to learn a compact si ...
- ArchLinux出现ACPI ERROR的解决方法
ArchLinux关机.重启时出现ACPI错误: ACPI Error:Method parse/execution failed \_SB.PCI0.PGON,AE_AML_LOOP_TIMEOUT ...
- linux内核(二)内核移植(DM365-DM368开发攻略——linux-2.6.32的移植)
一.介绍linux-2.6.32: Linux-2.6.32的网上介绍:增添了虚拟化内存 de-duplicacion.重写了 writeback 代码.改进了 Btrfs 文件系统.添加了 ATI ...
- POJ 2480
可以容易得知,F=sum(p*phi(n/p)).思路就断在这里了... 看过别人的,才知道如下: 由于gcd(i,n*m)=gcd(i,m)*gcd(i,n),所以gcd为积性函数.而积性函数之和为 ...