第一章 UNIX 基础知识
1.1 Unix体系结构
OS定义为一种软件,它控制计算机硬件资源,提供程序运行环境,一般称其为内核(kernel),它体积小,位于环境中心。
内核的接口为系统调用(system call),共用函数库构建在系统调用上,应用软件既可以使用公用函数库,也可以使用系统调用。shell是一种特殊的应用程序,它为运行其他应用程序提供一个接口。
下图为 UNIX 体系结构:
广义上,OS包括内核和一些软件,例如 Linux 是 GNU 操作系统使用的内核,可以称这种操作系统为 GNU/Linux,但是通常简称为 Linux。所以 Linux 本身有双重含义,内核和操作系统。
1.2 登陆
(1)登录名
用户登陆 UNIX 系统,键入 登录名,再键入 口令。系统在其口令文件(通常是/etc/passwd文件)中查看登录名。
我文件中的内容:
口令文件中的登陆项由7个以冒号分隔的字段组成,他们分别是:
登陆名、加密口令、数值用户ID、数值组、注释字段、起始目录、shell程序
其中,所有OS已将加密口令移到另一个文件中,第6章将说明这种文件以及访问他们的函数。
(2)shell
用户登陆后,用户可以向shell程序键入命令,某些系统会启动一个视窗管理程序,但 最终总会有一个shell程序运行在一个视窗中。
shell是一个命令解释器,它读取用户输入,然后执行命令。
用户通常用终端(交互式shell),有时通过文件(shell脚本,shell script)向shell进行输入。
下图是常见的shell
Steve Bourne在贝尔实验室开发的 Bourne shell。
Bourne-again shell 是GNU shell,所有Linux系统都提供这种shell,它被设计遵循 POSIX 的。
1.3 文件和目录
(1)文件系统
UNIX文件系统是目录和文件组成的一种层次结构,目录的起点称为根(root),名字是 / 。
目录(directory)是一个包含许多目录项的文件。
在逻辑上,可以认为每个目录项都包含一个文件名,文件属性信息(文件类型,文件大小...),stat 和 fstat 可以返回文件属性的一个信息结构。
目录项的逻辑视图与实际存放在磁盘上的方式是不同的。UNIX 文件系统的大多数实现并不在目录项中存放属性,这是因为当一个文件具有多个硬链接时,很难保持多个属性副本之间的同步。到第4章讨论硬链接时,这个问题将很好理解。
(2)文件名
目录中各个名字称为文件名(filename)。
文件名中不能出现斜线(/)和空操作符(null)。因为谢贤用于分隔各文件名构成路径名。空操作符用于终止一个路径名。
创建新目录时会自动创建两个文件名:. 和 .. ,点指向当前目录,点一点指向父目录。在最高层次的根目录中,点一点和点相同。
现在,所有的UNIX系统支持至少 255 各字符的文件名。
(3)路径名
一个或多个斜线分隔的文件名序列构成路径名(pathname),以斜线开头的路径称为绝对路径(absolute pathname),否则称为相对路径(relative pathname)。相对路径名引用相对于当前目录的文件。
// 列出一个目录中所有文件 #include "apue.h" #include <dirent.h> int main(int argc, char **argv) { DIR *dp; struct dirent *dirp; ) err_quit("usage: ls directory_name"); ])) == NULL) err_sys(]); while ((dirp = readdir(dp)) != NULL) printf("%s\n", dirp->name); closedir(dp); exit(); }
因为各种不同 UNIX 系统目录项的实际格式是不一样的,所以使用函数 opendir, readdir, closedir对目录进行处理。
opendir 函数返回指向 DIR 结构的指针,将这个指针传给 readdir 函数,我们不关心 DIR 结构中包含了什么。然后,在循环中调用 readdir 来读每个目录项。
readdir 函数返回一个指向 dirent 结构的指针,而当目录中已无可读的目录项时则返回 null 指针。在dirent 结构中取出的是每个目录项的名字(d_name)。使用该名字,此后可调用 stat 函数以获得该文件的所有属性。
当程序将结束,它以参数0调用函数 exit,exit终止程序,按惯例,参数0表示正常结束,参数1-255表示出错。
struct dirent 结构如下:
(4)工作目录
每个进程 都有一个工作目录(working directory),有时称为当前工作目录(current working directory)。所有相对路径名都从工作目录开始解释。进程可以用chdir函数更改其工作目录。
(5)起始目录
登陆时,工作目录设置为起始目录(home directory),该起始目录从口令文件中相应用户的登陆项中取得。
1.4 输入和输出
(1)文件描述符
文件描述符(file descriptor)通常时一个小的非负整数,内核用它标识一个特定进程正在访问的文件。当内核打开一个已有文件或创建一个新文件时,它返回一个文件描述符。在操作文件时,可以使用。
(2)标准输入、标准输出和标准出错
按惯例,每当运行一个新程序时,所有shell都为其打开三个文件描述符:标准输入(standard input)、标准输出(standard output)以及标准出错(standard error)。
如果项 ls 那样没有做什么特殊处理,则这三个描述符都链向终端。
大多数 shell 都提供一种方法,使其中 任何一个或所有这三个描述符都能重定向到某个文件,如:
ls > file.list
(3)不用缓冲的 I/O
函数 open、read、write、lseek以及close提供了不用缓冲的 I/O。这些函数都使用文件描述符。
// 将标准输入复制到标准输出 #include "apue.h" #define BUFFSIZE 1 int main(void) { int n; char buf[BUFFSIZE]; ) if (write(STDOUT_FILENO, buf, n) != n) err_sys("write error"); ) err_sys("read error"); exit(); }
由于键入值的传递是 FIFO结构的,所以无论 BUFFSIZE 设置为什么值,程序都能正常执行,但是执行效率不同。
(2)标准 IO
标准 I/O 函数提供一种对不用缓冲 I/O 函数的带缓冲接口。使用标准 I/O 函数无需担心如何选取最佳的缓冲区大小,例如上面程序中的 BUFFSIZE 常量的大小。
使用标准 I/O 函数的另一个优点是简化了对输入行的处理。例如,fgets函数读一完整的行,而read函数读指定字节数。
在5.4节中,我们将了解到,标准 I/O 函数库提供了使我们能够控制该库所使用的缓冲风格的函数。
// 用标准 I/O 将标准输入复制到标准输出 #include "apue.h" int main() { int c; while ((c = getc(stdin)) != EOF) if (putc(c, stdout) == EOF) err_sys("output error"); if (ferror(stdin)) err_sys("input_err"); exit(); }
EOF是一个常量,在stdio.h 中定义,使用 ctrl + D键入。 标准输入/标准输出 stdin 和 stdout 定义在 stdio.h 中,表示标准输入和标准输出文件。
1.5 程序和进程
(1)程序
程序(program)是存放在磁盘上、处于某个目录中的一个可执行文件。使用6个exec函数中的一个由内核将程序读入存储器,并使其执行。
(2)进程和进程ID
程序的执行实例被称为进程(process)。某些操作系统用任务(task)表示正被执行的程序。
UNIX系统确保每个进程都有一个唯一的数字标识符,称为进程ID(process ID)。进程ID总是一非负整数。
(3)进程控制
有三个用于进程控制的主要函数:fork、exec和waitpid。
// 从标准输入读命令并执行 #include "apue.h" #include <sys/wait.h> int main(void) { char buf[MAXLINE]; pid_t pid; int status; printf("%% "); while (fgets(buf, MAXLINE, stdin) != NULL) { ] == '\n') buf[strlen(buf) - ] = ; /* replace newline with null */ ) { err_sys("fork error"); } ) { execlp(buf, buf, (); err_ret("couldn't execute: %s", buf); exit(); } )) < ) err_sys("waitpid error"); printf("%% "); } exit(); }
fgets从标准输入一次读一行,当键入文件按结束字符EOF(使用 ctrl + D)作为行的第一个字符时,fgets返回一个 null 指针,程序退出。
由于 execlp 函数要求参数以 null 结尾,而不是换行符,所以需要进行替换。
(4)线程和线程ID
通常,一个进程只有一个控制线程(thread),同一时刻只执行一组机器指令,对于某些问题,如果不同部分各使用一个控制线程,那么可简化问题解决。另外,多个控制线程能充分利用多处理器系统的并行性。
同一个进程的线程共享同一地址空间,所以各线程在访问共享数据时需要采取同步措施以避免不一致性。
与进程相同,线程也用ID标识,但是线程ID只在它所属的进程内起作用。
1.6 出错处理
UNIX 函数出错时,通常返回一个负值,或者 null,而且整形变量 errno 通常被设置为函数有附加信息的一个值。
文件<errno.h>中定义了符号errno和可以赋予它的各种常量。
errno 以前的定义是:
extern int errno;
但是在支持线程的环境中,多个线程共享进程地址,每个线程都有属于自己的局部errno以避免一个线程干扰另一个线程。例如 Linux支持多线程存取 errno,将其定义为:
extern int * __errno_location(void); #define errno (*__errno_location())
对于errno应当知道两条规则。
第一:如果没有出错,则其值不会被一个例程清除。因此,仅当函数的返回值指明出错时,才检验其值。
第二:任一函数都不会将errno值设置为0,在<errno.h>中定义的所有常量都不为0
C标准定义了两个函数,它们帮助打印出错信息。
#include <string.h> char *strerror(int errnum);
#include <stdio.h> void perror(const char *msg);
它首先输出msg指向的字符串,然后一个冒号,一个空格,接着时errno值对应的出错信息,最后是一个换行符。
// 示例strerror和perror #include "apue.h" #include <errno.h> int main(int argc, char **argv) { fprintf(stderr, "EACCES: %s\n", strerror(EACCES)); errno = ENOENT; perror(argv[]); exit(); }
出错恢复:
可将<errno.h>中定义的各种出错分成致命性和非致命性两类。对于致命性错误,无法执行恢复动作,最多只能在用户屏幕上打印一条出错信息,或写入日志,然后终止。而对于非致命性出错,可以进行处理,大多数非致命性出错本质上是暂时的,如资源短缺。
与资源相关的非致命性出错包括 EAGAIN、ENFILE、ENOBUFS、ENOLCK、ENOSPC、ENOSR、EWOULDBLOCK,有时 ENOMEM也是非致命性,当EBUSY指明共享资源正在使用时,可以将他作为非致命性出错处理,当EINTR中断一慢速系统调用时,可 将它作为非致命性出错处理。
对于资源相关的非致命性出错,一般恢复动作时延迟一些时间,然后再试。
1.7 用户标识
(1)用户ID
口令文件登陆项中的用户ID(user ID)是个数值,它向系统标识各个不同的用户。
系统管理员在确定一个用户登陆名同时,确定用户ID,用户不能更改用户ID。
用户ID为0,是超级用户。
(2)组ID
口令文件登陆项也包括用户的组ID(group ID),它是一个数值。
组被用于将若干用户分到不同的项目组或者部门中去。这种机制允许同组各个成员之间共享资源,而组外用户则不能。
组文件将组名映射为数字组ID,它通常是 /etc/group
使用数字ID是历史上形成的,为的是节省磁盘空间,另外权限校验也比字符串更省时。对于用户而言使用字符串更方便,所以口令文件包含了登陆名和用户ID之间的映射关系。
(3)附加组ID
大多数UNIX系统允许用户属于多个组。
1.8 信号
信号(signal)是通知进程已发生某种情况的一种技术。
进程对于信号有三种选择:忽略,默认方式处理,捕捉。
1.9 时间值
UNIX系统一直使用两种不同的时间值:
(1)日历时间,该值是自 1970年1月1日00:00:00以来国际标准时间(UTC)所经过的秒数累计值(早期称为格林尼治标准时间)。
系统基本数据类型 time_t 用于保存这种事件值。
(2)进程时间,也被称为 CPU 时间,用于度量进程使用CPU资源。进程时间以时钟滴答计算。历史上有每秒50,60或100个滴答。
系统基本数据类型 clock_t 用于保存这种时间值。
当度量一个进程的执行时间时,UNIX系统使用三个进程时间值:
时钟时间,用户CPU时间,系统CPU时间。
时钟时间:进程运行时间总量。
用户CPU时间:执行用户指令所用的时间。(进程在用户空间的时间)
系统CPU时间:执行内核程序所经历的时间。(进程在内核空间的时间)
要获进程的三种时间,只需要执行命令 time(1)。
第一章 UNIX 基础知识的更多相关文章
- UNIX环境高级编程--第一章 UNIX基础知识
第一章 UNIX基础知识 1.2 UNIX体系结构 从严格意义上说,可将操作系统定义为一种软件,它控制计算机硬件资源,提供程序运行环境.我们将这种软件称为内核(kernel),因为 它相对较小,且 ...
- 《UNIX环境高级编程》(APUE) 笔记第一章 - UNIX基础知识
1 - UNIX基础知识 Github 地址 1. 操作系统 可将操作系统定义为一种软件,它控制计算机硬件资源,提供程序运行环境.通常将这种软件称为 内核 (kernel) .( Linux 是 GN ...
- apue学习笔记(第一章UNIX基础知识)
总所周知,UNIX环境高级编程是一本很经典的书,之前我粗略的看了一遍,感觉理解得不够深入. 听说写博客可以提高自己的水平,因此趁着这个机会我想把它重新看一遍,并把每一章的笔记写在博客里面. 我学习的时 ...
- UNIX环境高级编程 第1章 UNIX基础知识
所有操作系统都为运行在它之上的程序提供各种服务,典型的服务包括:执行新程序.打开文件.读写文件.分配存储空间.提供时间等. UNIX体系结构 严格来说,操作系统是一种软件,它控制计算机硬件资源,提供程 ...
- HTML5 Canvas核心技术图形动画与游戏开发(读书笔记)----第一章,基础知识
一,canvas元素 1 为了防止浏览器不支持canvas元素,我们设置“后备内容”(fallback content),下面紫色的字即为后备内容 <canvas id="canvas ...
- Python 学习系列----第一章:基础知识
1.1 常量-----不能改变它的值 1.2 数 在Python 中数可以分为整数.浮点数和复数. PS:在Python中不用区分'long int'类型.默认的整数类型可以任意长.(译者注:长度应该 ...
- iBatis第一章:基础知识概述 & MVC思想
一.java是一门十分受开发人员欢迎的语言,在开发语言排行榜中名列前茅,人们对其看法不尽相同,就我自身感受而言,我觉得java语言的主要优势体现在如下几方面:1.java属于开源语言,开发人员可以找到 ...
- 《Python基础教程》第一章:基础知识
如果希望只执行普通的除法,可以在程序前加上以下语句:from __future__ import division.还有另外一个方法,如果通过命令行运行Python, 可以使用命令开关-Qnew.此时 ...
- Web程序设计笔记-第一章:基础知识
1,Web服务器 (1)Web服务器操作 Web浏览器通过向服务器发送URL来与Web服务器进行通信.URL可以指定两种不同资源中的一种:某个文件或者某个程序. Web客户机和Web服务器之间所有的通 ...
随机推荐
- 关于objc.io
推荐一个特别棒的项目:objc.io 原版地址:http://www.objc.io/ 中国版地址:http://objccn.io/ 欢迎大家前去学习,如果你有不错的东西,也欢迎跟帖分享.
- 5.jQuery&Ajax
1.jQuery 什么是 jQuery ? jQuery是一个JavaScript函数库.jQuery是一个轻量级的"写的少,做的多"的JavaScript库.包含以下功能: HT ...
- BZOJ3329: Xorequ(二进制数位dp 矩阵快速幂)
题意 题目链接 Sol 挺套路的一道题 首先把式子移一下项 \(x \oplus 2x = 3x\) 有一件显然的事情:\(a \oplus b \leqslant c\) 又因为\(a \oplus ...
- 零基础逆向工程39_Win32_13_进程创建_句柄表_挂起方式创建进程
1 进程的创建过程 打开系统 --> 双击要运行的程序 --> EXE开始执行 步骤一: 当系统启动后,创建一个进程:Explorer.exe(也就是桌面进程) 步骤二: 当用户双击某一个 ...
- 栅格那点儿事(一)---Raster是个啥子东西
Raster是个啥子东西 现如今,不仅是在遥感应用中能看到花花绿绿的影像了,在GIS应用中也能随处看到她们的身影.在各种在线地图中,卫星影像作为底图与矢量的道路层叠加:高程DEM作为高程来源实现地形的 ...
- C++ Knowledge series 5
Programming language evolves always along with Compiler's evolvement On the Cusp of the Object Model ...
- 03、IDEA下Spark API编程
03.IDEA下Spark API编程 3.1 编程实现Word Count 3.1.1 创建Scala模块 3.1.2 添加maven支持,并引入spark依赖 <?xml version=& ...
- C#自定义规则对比两个集合的对象是否相等
IList<获取的类> ret = 类的结果集; return ret.Except(另一个相同类型的对象列表集, new AClassComPare()): public class A ...
- 解方程求PH值,POJ(2006)
题目链接:http://poj.org/problem?id=2006 解题报告: 题意看了半天,没看懂,再加上化学没学好,更加让我头痛. 假设1L溶解了x摩尔的酸:ka=m*x*nx/ori-x; ...
- linux客户端传输文件到Windows本地
1.rz/sz安装及使用方法 和 FileZilla 功能类似用于上传文件,上传速度比较慢适用比较小的文件 yum安装: $ sudo yum install lrzsz 打开SecureCRT ...