UNIX标准化及实现之限制
前言
UNIX系统实现定义了很多幻数和常量,其中有很多已被硬编码(关于硬编码和软编码:http://www.cnblogs.com/chenkai/archive/2009/04/10/1432903.html)进程序中,或用特定的技术确定。由于大量标准化工作的努力,已有若干种可移植的方法用以确定这些幻数和实现定义的限制。这非常有助于软件的可移植性。
以下两种类型的限制是必需的:
(1)编译时限制(例如,短整型的最大值是什么?)。
(2)运行时限制(例如,文件名可以有多少个字符?)。
编译时限制可在头文件中定义,程序在编译时可以包含这些头文件。但是,运行时限制则要求进程调用一个函数以获得此种限制值。
另外,某些限制在一个给定的实现中可能是固定的(因此可以静态地在一个头文件中定义),而在另一个实现上则可能是变化的(需要一个运行时函数调用)。
为了解决这类问题,提供了以下三种限制:
(1)编译时限制(头文件)。
(2)不与文件或目录相关联的运行时限制(sysconf函数)。
(3)与文件或目录相关联的运行时限制(pathconf和fpathconf函数)。
使事情变得更复杂的是,如果一个特定的运行时限制在一个给定的系统上并不改变,则可将其静态地定义在一个头文件中。但是,如果没有将其定义在头文件中,则应用程序就必须调用三个conf函数中的一个,以确定其运行时的值。
一、ISO C 限制
ISO C定义的限制都是编译时限制。文件<limits.h>中定义的C标准限制如下:
表1 <limits.h>中定义的整型值大小
名字 | 说明 | 最小可接受值(用于16位整型系统) | 典型值(32位Linux系统) |
CHAR_BIT CHAR_MAX CHAR_MIN SCHAR_MAX SCHAR_MIN UCHAR_MAX |
字符的位数 字符的最大值 字符的最小值 带符号字符的最大值 带符号字符的最小值 不带符号字符的最大值 |
8 |
8 |
INT_MAX INT_MIN UINT_MAX |
整型的最大值 整型的最小值 不带符号整型的最大值 |
32 767 |
2 147 483 647 |
SHRT_MIN SHRT_MAX USHRT_MAX |
短整型的最小值 短整型的最大值 不带符号短整型的最大值 |
-32767 |
-32768 |
LONG_MAX LONG_MIN ULONG_MAX |
长整型的最大值 长整型的最小值 不带符号长整型的最大值 |
2 147 483 647 |
2 147 483 647 |
LLONG_MAX LLONG_MIN ULLONG_MAX |
长长整型的最大值 长长整型的最小值 不带符号长长整型的最大值 |
9 223 372 036 854 775 807 |
9 223 372 036 854 775 807 |
MB_LEN_MAX | 多字节字符常量中的最大字节数 |
1 |
16 |
这些常量总是定义在头文件中,而且在一个给定系统中不会改变。注意,对不带符号的数据类型都没有列出其最小值,它们都应为0。在64位系统中,其long整型的最大值与表中long long整型最大值相匹配。
我们将会遇到的一个不同之处是系统是否提供带符号或不带符号的字符集。从上表中,我们可以看到CHAR_MIN等于SCHAR_MIN,CHAR_MAX等于SCHAR_MAX;如果系统使用不带符号的字符集,则CHAR_MIN等于0,CHAR_MAX等于UCHAR_MAX。
我们会遇到的另一个ISO C常量是FOPEN_MAX,这是具体实现保证可同时打开的标准I/O流的最小数。该值在头文件<stdio.h>中定义,其值最小是8。POSIX.1中的STREAM_MAX(若定义的话)必需有与FOPEN_MAX相同的值。
ISO C在<stdio.h>中还定义了常量TMP_MAX,这是由tmpnam函数产生的唯一文件名的最大数。
表2 在各种平台上的ISO限制
限制 | FreeBSD5.2.1 | Linux 2.4.22 | Mac OS X 10.3 | Solaris 9 |
FOPEN_MAX TMP_MAX |
20 |
16 |
20 |
20 |
ISO C还定义了常量FILENAME_MAX,因为某些操作系统实现在历史上将它定义得太小,以至于不能满足应用的需求,所以我们应避免使用该常量。
二、POSIX限制
POSIX.1定义了很多涉及操作系统实现限制的常量,我们只关心与基本POSIX.1接口有关的部分。这些限制和常量被分成下列5类。
(1)不变的最小值:见表3。
(2)不变值:SSIZE_MAX。
(3)运行时可以增加的值:CHARCLASS_NAME_MAX、COLL_WEIGHTS_MAX、LINE_MAX、NGROUPS_MAX以及RE_DUP_MAX。
(4)运行时不变的值(可能不确定):ARG_MAX、CHILD_MAX、HOST_NAME_MAX、LOGIN_NAME_MAX、OPEN_MAX、PAGESIZE、RE_DUP_MAX、STREAM_MAXS、SYMLOOP_MAX、TTY_NAME_MAX以及TZNAME_MAX。
(5)路径名可变值(可能不确定):FILESIZEBITS、LINK_MAX、MAX_CANON、MAX_INPUT、NAME_MAX、PATH_MAX、PIPE_BUF以及SYMLINK_MAX。
表3 <limits.h>中的POSIX.1不变最小值
名字 |
说明:以下各项的最小可接受值 |
值 |
_POSIX_ARG_MAX | exec函数的参数长度 |
4096 |
_POSIX_CHILD_MAX | 每个实际用户ID的子进程数 |
25 |
_POSIX_HOST_NAME_MAX | gethostname函数返回的主机名最大长度 |
255 |
_POSIX_LINK_MAX | 指向一个文件的链接数 |
8 |
_POSIX_LOGIN_NAME_MAX | 登录名的最大长度 |
9 |
_POSIX_MAX_CANON | 终端规范输入队列的字节数 |
255 |
_POSIX_MAX_INPUT | 终端输入队列的可用空间 |
255 |
_POSIX_NAME_MAX | 文件名中的字节数,不包括终止字符null |
14 |
_POSIX_NGROUPS_MAX | 每个进程同时对添加组ID数 |
8 |
_POSIX_OPEN_MAX | 每个进程的打开文件数 |
20 |
_POSIX_PATH_MAX | 路径名中的字节数,包括终止字符null |
256 |
_POSIX_PIPE_BUF | 能原子地写到管道的字节数 |
512 |
_POSIX_RE_DUP_MAX | 当使用间隔表示法\{m,n\}时,regexec和regcomp函数允许的基本正则表达式的重复出现次数 |
255 |
_POSIX_SSIZE_MAX | 能存储在ssize_t对象中的值 |
32767 |
_POSIX_STREAM_MAX | 一个进程能同时打开的标准I/O流数 |
8 |
_POSIX_SYMLINK_MAX | 符号链接中的字节数 |
255 |
_POSIX_SYMLOOP_MAX | 在解析路径名时可遍历的符号链接数 |
8 |
_POSIX_TTY_NAME_MAX | 终端设备名长度,包括终止字符null |
9 |
_POSIX_TZNAME_MAX | 时区名字节数 |
6 |
上述5类共44个限制和常量中,有一些可定义在<limits.h>中,其余的则按照具体条件可定义或不定义。
表3中列出了19个不变最小值,这些值是不变的——它们并不随系统而改变。它们指定了这些特征最具约束性的值。一个符合POSIX.1的实现应当提供至少这样大的值。这就是为什么将它们称为最小值的原因,虽然它们的名字都包含了MAX。另外,为了保证可移植性,一个严格遵循POSIX的应用程序不应要求更大的值。
一个严格遵循(strictly conforming)POSIX的应用程序有别于仅遵循POSIX(merely POSIX Confirming)的应用程序。一个遵循POSIX的应用程序只使用在IEEE标准1003.1-2001中定义的接口。一个严格遵循POSIX的应用程序也是遵循POSIX的,但除此之外,它还应不依赖于POSIX未定义的行为,不使用任何已废弃的接口,以及不要求所使用的常量值大于上表中所列出的最小值。
不幸的是,这些不变最小值中的某一些在实际应用中太小了。例如,目前在大多数UNIX系统中,每个进程可同时打开的文件数远远超过20。另外,_POSIX_PATH_MAX的最小限制值为255,这也太小了,路径名可能会超过这一限制。这意味着在编译时不能使用_POSIX_OPEN_MAX和_POSIX_PATH_MAX这两个常量作为数组长度。
表3中的每一个不变最小值都有一个相关的实现值,其名字是将表中的名字删除前缀_POSIX_后构成的。不带有前导_POSIX_的名称打算作为给定实现支持的实际值(这19个实现值是上面5类中(2)-(5):不变值、运行时可增加的值、运行时不变的值以及路径名可变值)。问题是并不能确保所有这19个实现值都在<limits.h>头文件中定义。
例如,某个特定值可能不在此头文件中定义,其理由是:一个给定进程的实际值可能依赖于系统的存储总量。如果没有在头文件中定义这些值,则不能在编译时使用它们作为数组边界。所以POSIX提供了三个运行时函数以供调用,它们是:sysconf、pathconf以及fpathconf。使用这三个函数可以在运行时得到实际的实现值。但是,还有一个问题,其中某些值由POSIX.1定义为“可能不确定的”(逻辑上无限的),这就意味着该值没有实际上限。例如在Linux中,readv或writev可用的iovec结构数仅受系统存储总量的限制。所以,在Linux系统中,IOV_MAX被认为是不确定的。
三、XSI限制
XSI还定义了处理实现限制的下面几个常量:
(1)不变最小值:表4中列出的10个常量。
(2)数值限制:LONG_BIT和WORE_BIT。
(3)运行时不变值(可能不确定):ATEXIT_MAX、IOV_MAX以及PAGE_SIZE。
表4 <limits.h>中的XSI不变最小值
名字 | 说明 | 最小可接受值 | 典型值 |
NL_ARGMAX | printf和scanf调用中的最大数字值 | 9 | 9 |
NL_LANGMAX | LANG环境变量中的最大字节数 | 14 | 14 |
NL_MSGMAX | 最大消息数 | 32767 | 32767 |
NL_NMAX | N对1映射字符中的最大字节数 | 未指定 | 1 |
NL_SETMAX | 最大集合数 | 255 | 255 |
NL_TEXTMAX | 消息字符串中的最大字符数 | _POSIX2_LINE_MAX | 2048 |
NZERO | 默认的进程优先级 | 20 | 20 |
_XOPEN_IOV_MAX | readv或writev可使用的最大iovec结构数 | 16 | 16 |
_XOPEN_NAME_MAX | 文件名中的字节数 | 255 | 255 |
_XOPEN_PATH_MAX | 路径名中的字节数 | 1024 | 1024 |
四、sysconf、pathconf和fpathconf函数
我们已列出了实现必须支持的各种最小值,但是怎样才能找到一个特定系统实际支持的限制值呢?正如前面提到的,某些限制值在编译时是可用的,而另外一些则必须在运行时确定。我们也曾提及在一个给定的系统中某些限制值是不会更改的,而其他限制值则与文件和目录相关联,是可以改变的。运行时限制可通过调用下面三个函数中的一个而取得:
#include <unistd.h>
long sysconf( int name );
long pathconf( const char *pathname, int name );
long fpathconf( int filedes, int name );
所有函数返回值:若成功则返回相应值;若出错则返回-1。(此处说的有点太过笼统,可参考下面的英文解释了解详情)
SYNOPSIS
#include <unistd.h>
long sysconf(int name);
DESCRIPTION
POSIX allows an application to test at compile- or run-time whether cer-
tain options are supported, or what the value is of certain configurable
constants or limits.
RETURN VALUE
If name is invalid, -1 is returned, and errno is set to EINVAL. Other-
wise, the value returned is the value of the system resource and errno is
not changed. In the case of options, a positive value is returned if a
queried option is available, and -1 if it is not. In the case of limits,
-1 means that there is no definite limit.
SYNOPSIS
#include <unistd.h>
long fpathconf(int filedes, int name);
long pathconf(char *path, int name);
DESCRIPTION
fpathconf() gets a value for the configuration option name for the open
file descriptor filedes.
pathconf() gets a value for configuration option name for the filename
path.
RETURN VALUE
The limit is returned, if one exists. If the system does not have a limit
for the requested resource, -1 is returned, and errno is unchanged. If
there is an error, -1 is returned, and errno is set to reflect the nature
of the error.
后两个函数之间的差别是一个用路径名作为其参数,另一个则取文件描述符作为参数。
表5 sysconf的限制及name参数(用于标识系统限制,以_SC_开始的常量用作标识运行时限制的sysconf参数)
限制名 | 说明 | name参数 |
ARG_MAX | exec函数的参数最大长度(字节数) | _SC_ARG_MAX |
ATEXIT_MAX | 可用atexit函数登记的最大函数个数 | _SC_ATEXIT_MAX |
CHILD_MAX | 每个实际用户ID的最大进程数 | _SC_CHILD_MAX |
clock ticks/second | 每秒时钟滴答数 | _SC_CLK_TCK |
COLL_WEIGHTS_MAX | 在本地定义文件中可以赋予LC_COLLATE顺序关键字项的最大权重数 | _SC_COLL_WEIGHTS_MAX |
HOST_NAME_MAX | gethostname函数返回的主机名最大长度 | _SC_HOST_NAME_MAX |
IOV_MAX | readv或writev函数可以使用的iovec结构的最大数 | _SC_IOV_MAX |
LINE_MAX | 实用程序输入行的最大长度 | _SC_LINE_MAX |
LOGIN_NAME_MAX | 登录名的最大长度 | _SC_LOGIN_NAME_MAX |
NGROUPS_MAX | 每个进程同时添加的最大进程组ID数 | _SC_NGROUPS_MAX |
OPEN_MAX | 每个进程的最大打开文件数 | _SC_OPEN_MAX |
PAGESIZE | 系统存储页长度(字节数) | _SC_PAGESIZE |
PAGE_SIZE | 系统存储页长度(字节数) | _SC_PAGE_SIZE |
RE_DUP_MAX | 当使用间隔表示法\{m,n\}时,regexec和regcomp函数允许的基本正则表达式的重复出现次数 | _SC_RE_DUP_MAX |
STREAM_MAX | 在任一时刻每个进程的最大标准I/O流数,如若定义,则其值一定与FOPEN_MAX相同 | _SC_STREAM_MAX |
SYMLOOP_MAX | 在解析路名期间,可遍历的符号链接数 | _SC_SYMLOOP_MAX |
TTY_NAME_MAX | 终端设备名长度,包括终止字符null | _SC_TTY_NAME_MAX |
TZNAME_MAX | 时区名的最大字节数 | _SC_TZNAME_MAX |
表6 pathconf和fpathconf的限制及name参数(以_PC_开始的常量用作标识运行时限制的pathconf或fpathconf参数)
限制名 | 说明 | name参数 |
FILESIZEBITS | 以带符号整型值表示在指定目录中允许的普通文件最大长度所需的最少位数 | _PC_FILESIZEBITS |
LINK_MAX | 文件链接数的最大值 | _PC_LINK_MAX |
MAX_CANON | 终端规范输入队列的最大字节数 | _PC_MAX_CANON |
MAX_INPUT | 终端输入队列可用空间的字节数 | _PC_MAX_INPUT |
NAME_MAX | 文件名的最大字节数(不包括终止字符null) | _PC_NAME_MAX |
PATH_MAX | 相对路径名的最大字节数,包括终止字符null | _PC_PATH_MAX |
PIPE_BUF | 能原子地写到管道的最大字节数 | _PC_PIPE_BUF |
SYMLINK_MAX | 符号链接中的字节数 | _PC_SYMLINK_MAX |
我们需要更详细地说明这三个函数的不同返回值:
(1)如果name不是表5和表6的第3列中的一个合适的常量,则所有这三个函数都会返回-1,并将errno设置为EINVAL。
(2)有些name可以返回变量的值(返回值>=0),或者返回-1,这表示该值是不确定的,此时并不改变errno的值。
(3)_SC_CLK_TCK的返回值是每秒钟的时钟滴答数,以用于times函数的返回值。
对于pathconf的参数pathname以及fpathconf的参数filedes有一些限制。如果不满足其中任何一个限制,则结果是未定义的:
(1)_PC_MAX_CANON和_PC_MAX_INPUT所引用的文件必须是终端文件。
(2)_PC_LINK_MAX所引用的文件可以是文件或目录。如果是目录,则返回值用于目录本身(而不是用于目录内的文件名项)。
(3)_PC_FILESIZEBITS和_PC_NAME_MAX所引用的文件必须是目录,返回值用于该目录中的文件名。
(4)_PC_PATH_MAX引用的文件必须是目录。当所指定的目录是工作目录时,返回值是相对路径名的最大长度(不幸的是,这不是我们想要知道的一个绝对路径名的实际最大长度)。
(5)_PC_PIPE_BUF所引用的文件必须是管道、FIFO或目录。在管道或FIFO情况下,返回值是对所引用的管道或FIFO的限制值。对于目录,返回值是对在该目录中创建的任一FIFO的限制值。
(6)_PC_SYMLINK_MAX所引用的文件必须是目录。返回值是该目录中符号链接可能包含的字符串的最大长度。
程序清单2-1 构建C程序以打印所有得到支持的系统配置限制(竟然可以使用awk编写C程序,就这个实例来说,使用awk构建C程序比直接编写要简单高效多了)
[root@localhost apue]# cat prog2-1.awk
BEGIN{
printf("#include \"apue.h\"\n")
printf("#include <errno.h>\n")
printf("#include <limits.h>\n")
printf("\n")
printf("static void pr_sysconf(char *, int);\n")
printf("static void pr_pathconf(char *, char *, int);\n")
printf("\n")
printf("int\n")
printf("main(int argc, char *argv[])\n")
printf("{\n")
printf("\tif(argc != 2)\n")
printf("\t\terr_quit(\"usage: a.out <dirname>\");\n\n")
FS="\t+"
while(getline <"sysconf.sym" > )
{
printf("#ifdef %s\n", $)
printf("\tprintf(\"%s defined to be %%d\\n\", %s+0);\n", $, $)
printf("#else\n")
printf("\tprintf(\"no symbol for %s\\n\");\n", $)
printf("#endif\n")
printf("#ifdef %s\n", $)
printf("\tpr_sysconf(\"%s =\", %s);\n", $, $)
printf("#else\n")
printf("\tprintf(\"no symbol for %s\\n\");\n", $)
printf("#endif\n")
}
close("sysconf.sym") while(getline <"pathconf.sym" > )
{
printf("#ifdef %s\n", $)
printf("\tprintf(\"%s defined to be %%d\\n\", %s+0);\n", $, $)
printf("#else\n")
printf("\tprintf(\"no symbol for %s\\n\");\n", $)
printf("#endif\n")
printf("#ifdef %s\n", $)
printf("\tpr_pathconf(\"%s =\", argv[1], %s);\n", $, $)
printf("#else\n")
printf("\tprintf(\"no symbol for %s\\n\");\n", $)
printf("#endif\n")
}
close("pathconf.sym")
exit
}
END{
printf("\texit(0);\n")
printf("}\n\n")
printf("static void\n")
printf("pr_sysconf(char *mesg, int name)\n")
printf("{\n")
printf("\tlong val;\n\n")
printf("\tfputs(mesg, stdout);\n")
printf("\terrno = 0;\n")
printf("\tif((val = sysconf(name)) < 0) {\n")
printf("\t\tif(errno != 0) {\n")
printf("\t\t\tif(errno == EINVAL)\n")
printf("\t\t\t\tfputs(\" (not supported)\\n\", stdout);\n")
printf("\t\t\telse\n")
printf("\t\t\t\terr_sys(\"sysconf error\");\n")
printf("\t\t} else {\n")
printf("\t\t\tfputs(\"(no limit)\\n\", stdout);\n")
printf("\t\t}\n")
printf("\t}else {\n")
printf("\t\tprintf(\" %%ld\\n\", val);\n")
printf("\t}\n")
printf("}\n\n")
printf("static void\n")
printf("pr_pathconf(char *mesg, char *path, int name)\n")
printf("{\n")
printf("\tlong val;\n")
printf("\n")
printf("\tfputs(mesg, stdout);\n")
printf("\terrno = 0;\n")
printf("\tif((val = pathconf(path, name)) < 0) {\n")
printf("\t\tif(errno != 0){\n")
printf("\t\t\tif(errno == EINVAL)\n")
printf("\t\t\t\tfputs(\" (not supported)\\n\", stdout);\n")
printf("\t\t\telse\n")
printf("\t\t\t\terr_sys(\"pathconf error, path = %%s\", path);\n")
printf("\t\t} else {\n")
printf("\t\t\tfputs(\" (no limits)\\n\", stdout);\n")
printf("\t\t}\n")
printf("\t} else {\n")
printf("\t\tprintf(\" %%ld\\n\", val);\n")
printf("\t}\n")
printf("}\n")
}
该awk程序读取两个输入文件——pathconf.sym和sysconf.sym(可从www.apuebook.com获取),这两个文件中包含了用制表符分隔的限制名和符号列表。并非每种平台都会定义所有符号,所以围绕每个pathconf和sysconf调用,awk程序都使用了必要的#ifdef语句。
例如,awk程序将输入文件中类似于下列形式的行:
NAME_MAX _PC_NAME_MAX
转换成下列C代码:
#ifdef NAME_MAX
printf("NAME_MAX defined to be %d\n", NAME_MAX+);
#else
printf("no symbol for NAME_MAX\n");
#endif
#ifdef _PC_NAME_MAX
pr_pathconf("NAME_MAX =", argv[], _PC_NAME_MAX);
#else
printf("no symbol for _PC_NAME_MAX\n");
#endif
要使用程序清单2-1生成C程序代码程序清单2-2,只要在命令终端运行命令:
[root@localhost apue]# awk -f prog2-.awk sysconf.sym pathconf.sym >prog2-.c
即可产生如下的prog2-2.c
程序清单2-2 打印所有可能的sysconf和pathconf值
[root@localhost apue]# cat prog2-.c
#include "apue.h"
#include <errno.h>
#include <limits.h> static void pr_sysconf(char *, int);
static void pr_pathconf(char *, char *, int); int
main(int argc, char *argv[])
{
if(argc != )
err_quit("usage: a.out <dirname>"); #ifdef ARG_MAX
printf("ARG_MAX defined to be %d\n", ARG_MAX+);
#else
printf("no symbol for ARG_MAX\n");
#endif
#ifdef _SC_ARG_MAX
pr_sysconf("ARG_MAX =", _SC_ARG_MAX);
#else
printf("no symbol for _SC_ARG_MAX\n");
#endif
#ifdef ATEXIT_MAX
printf("ATEXIT_MAX defined to be %d\n", ATEXIT_MAX+);
#else
printf("no symbol for ATEXIT_MAX\n");
#endif
#ifdef _SC_ATEXIT_MAX
pr_sysconf("ATEXIT_MAX =", _SC_ATEXIT_MAX);
#else
printf("no symbol for _SC_ATEXIT_MAX\n");
#endif
#ifdef CHARCLASS_NAME_MAX
printf("CHARCLASS_NAME_MAX defined to be %d\n", CHARCLASS_NAME_MAX+);
#else
printf("no symbol for CHARCLASS_NAME_MAX\n");
#endif
#ifdef _SC_CHARCLASS_NAME_MAX
pr_sysconf("CHARCLASS_NAME_MAX =", _SC_CHARCLASS_NAME_MAX);
#else
printf("no symbol for _SC_CHARCLASS_NAME_MAX\n");
#endif
#ifdef CHILD_MAX
printf("CHILD_MAX defined to be %d\n", CHILD_MAX+);
#else
printf("no symbol for CHILD_MAX\n");
#endif
#ifdef _SC_CHILD_MAX
pr_sysconf("CHILD_MAX =", _SC_CHILD_MAX);
#else
printf("no symbol for _SC_CHILD_MAX\n");
#endif
#ifdef CLOCKTICKSPERSECOND /*clock ticks/second*/
printf("CLOCKTICKSPERSECOND /*clock ticks/second*/ defined to be %d\n", CLOCKTICKSPERSECOND /*clock ticks/second*/+);
#else
printf("no symbol for CLOCKTICKSPERSECOND /*clock ticks/second*/\n");
#endif
#ifdef _SC_CLK_TCK
pr_sysconf("CLOCKTICKSPERSECOND /*clock ticks/second*/ =", _SC_CLK_TCK);
#else
printf("no symbol for _SC_CLK_TCK\n");
#endif
#ifdef COLL_WEIGHTS_MAX
printf("COLL_WEIGHTS_MAX defined to be %d\n", COLL_WEIGHTS_MAX+);
#else
printf("no symbol for COLL_WEIGHTS_MAX\n");
#endif
#ifdef _SC_COLL_WEIGHTS_MAX
pr_sysconf("COLL_WEIGHTS_MAX =", _SC_COLL_WEIGHTS_MAX);
#else
printf("no symbol for _SC_COLL_WEIGHTS_MAX\n");
#endif
#ifdef HOST_NAME_MAX
printf("HOST_NAME_MAX defined to be %d\n", HOST_NAME_MAX+);
#else
printf("no symbol for HOST_NAME_MAX\n");
#endif
#ifdef _SC_HOST_NAME_MAX
pr_sysconf("HOST_NAME_MAX =", _SC_HOST_NAME_MAX);
#else
printf("no symbol for _SC_HOST_NAME_MAX\n");
#endif
#ifdef IOV_MAX
printf("IOV_MAX defined to be %d\n", IOV_MAX+);
#else
printf("no symbol for IOV_MAX\n");
#endif
#ifdef _SC_IOV_MAX
pr_sysconf("IOV_MAX =", _SC_IOV_MAX);
#else
printf("no symbol for _SC_IOV_MAX\n");
#endif
#ifdef LINE_MAX
printf("LINE_MAX defined to be %d\n", LINE_MAX+);
#else
printf("no symbol for LINE_MAX\n");
#endif
#ifdef _SC_LINE_MAX
pr_sysconf("LINE_MAX =", _SC_LINE_MAX);
#else
printf("no symbol for _SC_LINE_MAX\n");
#endif
#ifdef LOGIN_NAME_MAX
printf("LOGIN_NAME_MAX defined to be %d\n", LOGIN_NAME_MAX+);
#else
printf("no symbol for LOGIN_NAME_MAX\n");
#endif
#ifdef _SC_LOGIN_NAME_MAX
pr_sysconf("LOGIN_NAME_MAX =", _SC_LOGIN_NAME_MAX);
#else
printf("no symbol for _SC_LOGIN_NAME_MAX\n");
#endif
#ifdef NGROUPS_MAX
printf("NGROUPS_MAX defined to be %d\n", NGROUPS_MAX+);
#else
printf("no symbol for NGROUPS_MAX\n");
#endif
#ifdef _SC_NGROUPS_MAX
pr_sysconf("NGROUPS_MAX =", _SC_NGROUPS_MAX);
#else
printf("no symbol for _SC_NGROUPS_MAX\n");
#endif
#ifdef OPEN_MAX
printf("OPEN_MAX defined to be %d\n", OPEN_MAX+);
#else
printf("no symbol for OPEN_MAX\n");
#endif
#ifdef _SC_OPEN_MAX
pr_sysconf("OPEN_MAX =", _SC_OPEN_MAX);
#else
printf("no symbol for _SC_OPEN_MAX\n");
#endif
#ifdef PAGESIZE
printf("PAGESIZE defined to be %d\n", PAGESIZE+);
#else
printf("no symbol for PAGESIZE\n");
#endif
#ifdef _SC_PAGESIZE
pr_sysconf("PAGESIZE =", _SC_PAGESIZE);
#else
printf("no symbol for _SC_PAGESIZE\n");
#endif
#ifdef PAGE_SIZE
printf("PAGE_SIZE defined to be %d\n", PAGE_SIZE+);
#else
printf("no symbol for PAGE_SIZE\n");
#endif
#ifdef _SC_PAGE_SIZE
pr_sysconf("PAGE_SIZE =", _SC_PAGE_SIZE);
#else
printf("no symbol for _SC_PAGE_SIZE\n");
#endif
#ifdef RE_DUP_MAX
printf("RE_DUP_MAX defined to be %d\n", RE_DUP_MAX+);
#else
printf("no symbol for RE_DUP_MAX\n");
#endif
#ifdef _SC_RE_DUP_MAX
pr_sysconf("RE_DUP_MAX =", _SC_RE_DUP_MAX);
#else
printf("no symbol for _SC_RE_DUP_MAX\n");
#endif
#ifdef STREAM_MAX
printf("STREAM_MAX defined to be %d\n", STREAM_MAX+);
#else
printf("no symbol for STREAM_MAX\n");
#endif
#ifdef _SC_STREAM_MAX
pr_sysconf("STREAM_MAX =", _SC_STREAM_MAX);
#else
printf("no symbol for _SC_STREAM_MAX\n");
#endif
#ifdef SYMLOOP_MAX
printf("SYMLOOP_MAX defined to be %d\n", SYMLOOP_MAX+);
#else
printf("no symbol for SYMLOOP_MAX\n");
#endif
#ifdef _SC_SYMLOOP_MAX
pr_sysconf("SYMLOOP_MAX =", _SC_SYMLOOP_MAX);
#else
printf("no symbol for _SC_SYMLOOP_MAX\n");
#endif
#ifdef TTY_NAME_MAX
printf("TTY_NAME_MAX defined to be %d\n", TTY_NAME_MAX+);
#else
printf("no symbol for TTY_NAME_MAX\n");
#endif
#ifdef _SC_TTY_NAME_MAX
pr_sysconf("TTY_NAME_MAX =", _SC_TTY_NAME_MAX);
#else
printf("no symbol for _SC_TTY_NAME_MAX\n");
#endif
#ifdef TZNAME_MAX
printf("TZNAME_MAX defined to be %d\n", TZNAME_MAX+);
#else
printf("no symbol for TZNAME_MAX\n");
#endif
#ifdef _SC_TZNAME_MAX
pr_sysconf("TZNAME_MAX =", _SC_TZNAME_MAX);
#else
printf("no symbol for _SC_TZNAME_MAX\n");
#endif
#ifdef MAX_CANON
printf("MAX_CANON defined to be %d\n", MAX_CANON+);
#else
printf("no symbol for MAX_CANON\n");
#endif
#ifdef _PC_MAX_CANON
pr_pathconf("MAX_CANON =", argv[], _PC_MAX_CANON);
#else
printf("no symbol for _PC_MAX_CANON\n");
#endif
#ifdef MAX_INPUT
printf("MAX_INPUT defined to be %d\n", MAX_INPUT+);
#else
printf("no symbol for MAX_INPUT\n");
#endif
#ifdef _PC_MAX_INPUT
pr_pathconf("MAX_INPUT =", argv[], _PC_MAX_INPUT);
#else
printf("no symbol for _PC_MAX_INPUT\n");
#endif
#ifdef FILESIZEBITS
printf("FILESIZEBITS defined to be %d\n", FILESIZEBITS+);
#else
printf("no symbol for FILESIZEBITS\n");
#endif
#ifdef _PC_FILESIZEBITS
pr_pathconf("FILESIZEBITS =", argv[], _PC_FILESIZEBITS);
#else
printf("no symbol for _PC_FILESIZEBITS\n");
#endif
#ifdef LINK_MAX
printf("LINK_MAX defined to be %d\n", LINK_MAX+);
#else
printf("no symbol for LINK_MAX\n");
#endif
#ifdef _PC_LINK_MAX
pr_pathconf("LINK_MAX =", argv[], _PC_LINK_MAX);
#else
printf("no symbol for _PC_LINK_MAX\n");
#endif
#ifdef NAME_MAX
printf("NAME_MAX defined to be %d\n", NAME_MAX+);
#else
printf("no symbol for NAME_MAX\n");
#endif
#ifdef _PC_NAME_MAX
pr_pathconf("NAME_MAX =", argv[], _PC_NAME_MAX);
#else
printf("no symbol for _PC_NAME_MAX\n");
#endif
#ifdef PATH_MAX
printf("PATH_MAX defined to be %d\n", PATH_MAX+);
#else
printf("no symbol for PATH_MAX\n");
#endif
#ifdef _PC_PATH_MAX
pr_pathconf("PATH_MAX =", argv[], _PC_PATH_MAX);
#else
printf("no symbol for _PC_PATH_MAX\n");
#endif
#ifdef PIPE_BUF
printf("PIPE_BUF defined to be %d\n", PIPE_BUF+);
#else
printf("no symbol for PIPE_BUF\n");
#endif
#ifdef _PC_PIPE_BUF
pr_pathconf("PIPE_BUF =", argv[], _PC_PIPE_BUF);
#else
printf("no symbol for _PC_PIPE_BUF\n");
#endif
#ifdef SYMLINK_MAX
printf("SYMLINK_MAX defined to be %d\n", SYMLINK_MAX+);
#else
printf("no symbol for SYMLINK_MAX\n");
#endif
#ifdef _PC_SYMLINK_MAX
pr_pathconf("SYMLINK_MAX =", argv[], _PC_SYMLINK_MAX);
#else
printf("no symbol for _PC_SYMLINK_MAX\n");
#endif
exit();
} static void
pr_sysconf(char *mesg, int name)
{
long val; fputs(mesg, stdout);
errno = ;
if((val = sysconf(name)) < ) {
if(errno != ) {
if(errno == EINVAL)
fputs(" (not supported)\n", stdout);
else
err_sys("sysconf error");
} else {
fputs("(no limit)\n", stdout);
}
}else {
printf(" %ld\n", val);
}
} static void
pr_pathconf(char *mesg, char *path, int name)
{
long val; fputs(mesg, stdout);
errno = ;
if((val = pathconf(path, name)) < ) {
if(errno != ){
if(errno == EINVAL)
fputs(" (not supported)\n", stdout);
else
err_sys("pathconf error, path = %s", path);
} else {
fputs(" (no limits)\n", stdout);
}
} else {
printf(" %ld\n", val);
}
}
五、不确定的运行时限制
前面已经提及某些限制值可能是不确定的。我们遇到的问题是,如果这些限制值没有在头文件<limits.h>中定义,那么在编译时也就不能使用它们。但是,如果它们的值是不确定的,那么在运行时它们可能也是未定义的!让我们来观察两种特殊的情况:为一个路径名分配存储区,以及确定文件描述符的数目。
1、路径名
很多程序需要为路径名分配存储区。一般来说,在编译时就为其分配了存储区,而且不同的程序使用各种不同的幻数(其中很少是正确的)作为数组长度。例如,256、512、1024或标准I/O常量BUFSIZ。4.3BSD头文件<sys/param.h>中的常量MAXPATHLEN是正确的,但是很多4.3BSD应用程序并未使用它。
POSIX.1试图使用PATH_MAX值来帮助我们,但是如果此值是不确定的,那么仍是毫无帮助的。
如若在<limits.h>中定义了常量PATH_MAX,那么就没有任何问题;如果没有定义,则需调用pathconf。因为pathconf的返回值是基于工作目录的相对路径名的最大长度,而工作目录是其第一个参数,所以,指定根目录为第一个参数,并将得到的返回值加1作为结果值。如果pathconf指明PATH_MAX是不确定的,那么我们就只能猜测某个值。
对于PATH_MAX是否在路径名末尾包括一个null字符这一点,SUS v3之前的标准表述得不清楚。出于安全方面的考虑,如果操作系统实现遵循先前的标准版本,则需要在为路径名分配的存储数量上加1。
处理不确定结果这种情况的正确方法与如何使用所分配的存储空间有关。例如,如果我们为getcwd调用分配空间(返回当前工作目录的绝对路径名),并且分配的空间太小,则返回一个出错,并将errno设置为ERANGE。然后可调用realloc来增加分配的空间并重试。不断重复此操作,直到getcwd调用成功执行。
程序清单2-3 为路径名动态地分配空间
[root@localhost apue]# cat prog2-.c
#include "apue.h"
#include <errno.h>
#include <limits.h> #ifdef PATH_MAX
static int pathmax = PATH_MAX;
#else
static int pathmax = ;
#endif #define SUSV3 200112L static long posix_version = ; /* If PATH_MAX is indeterminate, no guarantee this is adequate */
#define PATH_MAX_GUESS 1024 char *
path_alloc(int *sizep) /* also return allocated size, if nonull */
{
char *ptr;
int size; if(posix_version == )
posix_version = sysconf(_SC_VERSION); if(pathmax == ) { /* first time trough */
errno = ;
if((pathmax = pathconf("/", _PC_PATH_MAX)) < ) {
if(errno == )
pathmax = PATH_MAX_GUESS; /* it's indeterminate */
else
err_sys("pathconf error for _PC_PATH_MAX");
} else {
pathmax++; /* add one since it's relative to root */
}
}
if(posix_version < SUSV3)
size = pathmax + ;
else
size = pathmax; if((ptr = malloc(size)) == NULL)
err_sys("malloc error for pathname"); if(sizep != NULL)
*sizep = size;
return(ptr);
}
2、最大打开文件数
守护进程(daemon process,是指在后台运行且不与终端相连接的一种进程,也常被称为精灵进程或后台进程)中一个常见的代码序列是关闭所有打开的文件。某些程序中有下列形式的代码序列:
#include <sys/param.h> for( i=; i<NOFILE; i++ )
close( i );
这段程序假定在<sys/param.h>头文件中定义了常量NOFILE。另外一些程序则使用某些<stdio.h>版本提供作为上限的常量_NFILE。某些程序则将其上限值硬编码为20.
我们希望用POSIX.1的OPEN_MAX来确定此值以提高可移植性,但是,如果此值是不确定的,则仍然有问题。如果我们编写了下列代码:
#include <unistd.h> for( i=; i<sysconf( _SC_OPEN_MAX ); i++ )
close( i );
而且如果OPEN_MAX是不确定的,那么for循环根本不会执行因为sysconf将返回-1。在这种情况下,最好的选择就是关闭所有描述符直至某个限制值(例如256)。如同上面的路径名实例一样,这样并不能保证在所有情况下都能正常工作,但这却是我们所能选择的最好方法。程序清单2-4中使用了这种技术:
程序清单2-4 确定文件描述符数
[root@localhost apue]# cat prog2-.c
#include "apue.h"
#include <errno.h>
#include <limits.h> #ifdef OPEN_MAX
static long openmax = OPEN_MAX;
#else
static long openmax = ;
#endif /*
* If OPEN_MAX is indeterminate, we're not
* guaranteed than this is adequate.
*/
#define OPEN_MAX_GUESS 256 long
open_max(void)
{
if(openmax == ) { /* first time through */
errno = ;
if((openmax = sysconf(_SC_OPEN_MAX)) < ) {
if(errno == )
openmax = OPEN_MAX_GUESS; /* it's indeterminate */
else
err_sys("sysconf error for _SC_OPEN_MAX");
}
}
return(openmax);
}
我们可以耐心地调用close,直至得到一个出错返回,但是从close(EBADF)出错返回并不区分无效描述符和没有打开的描述符。如果使用此技术,而且描述符9未打开,描述符10却打开了,那么将停止在9上,而不会关闭10.
某些实现将返回LONG_MAX作为限制值,但这与不限制其值在效果上是相同的。Linux对ATEXIT_MAX所取的限制值就属于此种情况。这将使程序的运行行为变得非常糟糕(浪费大量时间),因此它并不是一个好方法。
本篇博文内容摘自《UNIX环境高级编程》(第二版),仅作个人学习记录所用。关于本书可参考:http://www.apuebook.com/。
UNIX标准化及实现之限制的更多相关文章
- UNIX标准化及实现之UNIX标准化、UNIX系统实现、标准和实现的关系以及ISO C标准头文件
一.UNIX标准化 1.ISO C (International Organization for Standardization) 2.IEEE POSIX (Institue of Electri ...
- 《UNIX环境高级编程》笔记--UNIX标准化及实现
1.UNIX标准化 1.1.ISO C 1989 年后期,C程序设计语言的ANSI(American National Standards Institute) 标准X3. 15 9-1989得到批准 ...
- 第二章:UNIX标准化及实现
本章节介绍个UNIX编程环境的标准化的进展,对ISO C,POSIX和Single UNIX Specification三个主要标准进行了说明 本章后面部分介绍了限制的具体实例. 我学习本章的心得是: ...
- UNIX标准化及实现之POSIX标准必需头文件
POSIX标准定义的必需头文件 头文件 说明 <dirent.h> 目录项 <fcntl.h> 文件控制 <fnmatch.h> 文件名匹配类型 <glob. ...
- UNIX标准化及实现之标准之间的冲突
就整体而言,这些不同的标准之间配合得相当好.但是我们也很关注它们之间的差别,特别是ISO C标准和POSIX.1之间的差别. ISO C定义了函数clock,它返回进程使用的CPU时间,返回值类型是c ...
- UNIX标准化及实现之基本系统数据类型
历史上,某些UNIX系统变量已与某些C数据类型联系在一起.例如,历史上主.次设备号一直存放在一个16位的短整型中,8位表示主设备号,另外8位表示次设备号.但是,很多较大的系统需要用多于256个值来表示 ...
- UNIX标准化及实现之功能测试宏
在头文件中定义了很多POSIX.1和XSI的符号.但是除了POSIX.1和XSI的定义之外,大多数实现在这些头文件中也加上了它们自己的定义.如果在编译一个程序时,希望它只使用POSIX定义而不使用任何 ...
- UNIX标准化及实现之选项
POSIX.1的2001版,包括了ISO C标准所指定的各个函数.其接口分成了两类:必需接口和可选接口.可选接口按功能又进一步分成50个区.表1中按它们各自的选项代码总结了没有被弃用的编程接口.选项代 ...
- UNIX标准化及实现之POSIX标准可选头文件
POSIX标准定义的可选头文件 头文件 说明 <aio.h> 异步I/O <mqueue.h> 消息队列 <pthread.h> 线程 <sched.h> ...
随机推荐
- acdream 1044
题意:有你一个草坪,草的初始高度都是100,让你用割草机割,割草机只能横着或竖着割,每次割的高度一定,问你能不能割出给定的草坪出来. 考虑任意一个草被割要么是横着要么竖着,所以任意一个草必然是它所在行 ...
- 修改Android手机的“虚拟机堆大小”和android:largeHeap来防止APP内存溢出问题
使用“RAM Manager”修改“虚拟机堆大小”为某一个阀值 xxMB大小 修改 AndroidManifest.xml 里的 Application 标签的属性 android:largeHeap ...
- 排序算法:七大排序算法的PHP实现
由于最近在找工作,面试中难免会遇到一些算法题,所以就用PHP把七大排序算法都实现了一遍,也当做是一种复习于沉淀. 冒泡排序 2. 选择排序 3. 插入排序 4. 快速排序 5. 希尔排序 6. 归并排 ...
- 在windows7下配置PHP访问ICE中间件(ICE3.5.1+PHP5.4+Apache2.2 for vc9)
按照ICE的官方文档(http://doc.zeroc.com/display/Ice/Using+the+Windows+Binary+Distribution#UsingtheWindowsBin ...
- [转]Erlang不能错过的盛宴
Erlang不能错过的盛宴 (快步进入Erlang的世界) 作者:成立涛 (litaocheng@gmail.com) 作为程序员,我们曾经闻听很多“业界动态”,“技术革新”,曾经接触很多“高手箴言” ...
- Hbase 基本命令
启动Hbase:./start-hbase.sh 进入Hbase shell控制台:./hbase shell 查看所有表 list 查看数据库状态:status 查看数据库版本:vers ...
- Protocol Buffers编码详解,例子,图解
Protocol Buffers编码详解,例子,图解 本文不是让你掌握protobuf的使用,而是以超级细致的例子的方式分析protobuf的编码设计.通过此文你可以了解protobuf的数据压缩能力 ...
- linux高级数据存储
linux内此存储模式由5部分组成,自低向上的顺序: 物理卷,内核块设备驱动,内核文件系统驱动,虚拟文件系统,应用程序数据结构; 系统中所有的文件仅按此模式存储,无论是数据还是元数据,均在此模式下统一 ...
- SpringMVC学习笔记
1.严格实现MVC设计思想的框架,严格分层,减少耦合: 2.组件(红色必需) 2.1 DispatcherServlet 前端控制器 2.2 Controller 业务控制器 2.3 Handler ...
- Spring SimpleJdbcTemplate Querying examples
Here are few examples to show how to use SimpleJdbcTemplate query() methods to query or extract data ...