原子是一个指向唯一的、不可变的0个或任意多个字节序列的指针,大多数原子都是指向以空字符结束的字符串,但是任何一个指向任意字节序列的指针都可以使原子。任何原子只能出现一次。如果两个原子指向同一个内存单元时,则两个原子是相等的。仅仅比较两个字节序列相应的指针是否相等,就可以判断这两个字节序列是否相等了,这就是使用原子的好处之一;还有一个好处就是使用原子可以节省空间,因为每个序列只会出现一次。

本文地址:http://www.cnblogs.com/archimedes/p/c-atom.html,转载请注明源地址。

接口

Atom的接口很简单:

#ifndef ATOM_INCLUDED
#define ATOM_INCLUDED
extern int Atom_length(const char *str);
extern const char *Atom_new (const char *str, int len);
extern const char *Atom_string(const char *str);
extern const char *Atom_int (long n);
#endif

atom.h

Atom_new接收一个指向字节序列的指针以及该序列的字节数作为输入,它在原子表中增加一个该序列的拷贝,并且如果需要的话,返回原子表中指向该拷贝的指针(即原子)

原子总是以一个空字符结束,在必要的时候该空字符由Atom_new添加

Atom_string接收一个空字符串结束的字符串作为输入,在原子表中增加一个该串的拷贝,如果需要的话返回该原子

Atom_int返回长整数n的字符串表示的原子

Atom_length返回其原子参数的长度

实现

Atom的实现对原子表进行维护。Atom_new,Atom_string,Atom_int查找原子表,并都有可能在原子表中添加一个新的元素,而Atom_length仅仅查找原子表

#include "atom.h"

Atom_string,Atom_int可以在不知道原子表细节的情况下执行相应的操作

#include <string.h>
#include "assert.h"
const char *Atom_string(const char *str) {
assert(str);
return Atom_new(str, strlen(str));
}

Atom_int首先把它的参数转化为一个字符串,然后调用Atom_new:

#include <limits.h>
const char *Atom_int(long n) { /*将参数转换成一个字符串,然后调用Atom_new*/
char str[];
char *s = str + sizeof str; /*将s指向字符数组的尾部*/
unsigned long m;
if (n == LONG_MIN) /*处理最小的负长整数*/
m = LONG_MAX + 1UL;
else if (n < )
m = -n;
else
m = n;
do
*--s = m% + ''; /*对m取余获取最后一位数字倒序保存在字符数组中*/
while ((m /= ) > );
if (n < )
*--s = '-'; /*如果n是负数在结果前面加上’-‘号*/
return Atom_new(s, (str + sizeof str) - s);
}

Atom_int必须处理二进制补码数的不对称范围以及C的除法和取余运算的不确定性,无符号的除法和取余都具有良好的定义,因此Atom_int也可以通过使用无符号算术来避免使用有符号运算引起的不确定。

引入头文件和相关宏:

#include "atom.h"
#include <string.h>
#include "assert.h"
#include <limits.h>
#include "mem.h" /* 内存管理接口 */
#define NELEMS(x) ((sizeof (x))/(sizeof ((x)[0])))
/* 求数组中元素的个数 */

散列表显然是一个针对原子表的数据结构,散列表是一个入口表的指针数组,其中每一个元素都存有一个原子:

static struct atom {
struct atom *link; /*指向表中的下一个入口*/
int len; /*len存储序列的长度*/
char *str; /*str指向序列本身*/
} *buckets[]; /*散列表的长度小于2048*/

针对“an atom”的struct atom的小尾数法布局:

Atom_new计算由str[0……len-1]给定序列的散列值,并用buckets的元素个数对其取模,搜索由buckets中该散列值元素所指向的链表。如果发现str[0……len-1]已存在于表中,它将只是简单地返回该原子:

#define NELEMS(x) ((sizeof (x))/(sizeof ((x)[0])))  /* 求数组中元素的个数 */
const char *Atom_new(const char *str, int len) { /*接收一个指向字节序列的指针以及该序列的字节数,在原子表中增加一个该序列的拷贝*/
unsigned long h;
int i;
struct atom *p;
assert(str);
assert(len >= );
for (h = , i = ; i < len; i++) /*查找表算法*/
h = (h<<) + scatter[(unsigned char)str[i]];
h &= NELEMS(buckets)-;
for (p = buckets[h]; p; p = p->link) /*在buckets[h]中查找是否存在str*/
if (len == p->len) {
for (i = ; i < len && p->str[i] == str[i]; )
i++;
if (i == len)
return p->str; /*找到即返回*/
}
p = ALLOC(sizeof (*p) + len + ); /*没找到则新建原子*/
p->len = len;
p->str = (char *)(p + );
if (len > )
memcpy(p->str, str, len);
p->str[len] = '\0';
p->link = buckets[h];
buckets[h] = p;
return p->str;
}

Hash表结构:

Atom的实现对原子表进行维护,Atom_new、Atom_string以及Atom_int查找原子表,并且都有可能在原子表中添加一个新的元素,而Atom_length仅仅查找原子表。

完整实现代码如下:

#include "atom.h"
#include <string.h>
#include "assert.h"
#include <limits.h>
#include "mem.h" /* 内存管理接口 */
#define NELEMS(x) ((sizeof (x))/(sizeof ((x)[0]))) /* 求数组中元素的个数 */
static struct atom {
struct atom *link; /*指向表中的下一个入口*/
int len; /*len存储序列的长度*/
char *str; /*str指向序列本身*/
} *buckets[]; /*散列表的长度小于2048*/
static unsigned long scatter[] = { /*256入口数组,它将字节映射为随机数,这些随机数通过标准库的rand函数生成*/
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , ,
};
const char *Atom_string(const char *str) {
assert(str);
return Atom_new(str, strlen(str));
}
const char *Atom_int(long n) { /*将参数转换成一个字符串,然后调用Atom_new*/
char str[];
char *s = str + sizeof str; /*将s指向字符数组的尾部*/
unsigned long m;
if (n == LONG_MIN) /*处理最小的负长整数*/
m = LONG_MAX + 1UL;
else if (n < )
m = -n;
else
m = n;
do
*--s = m% + ''; /*对m取余获取最后一位数字倒序保存在字符数组中*/
while ((m /= ) > );
if (n < )
*--s = '-'; /*如果n是负数在结果前面加上’-‘号*/
return Atom_new(s, (str + sizeof str) - s);
}
const char *Atom_new(const char *str, int len) { /*接收一个指向字节序列的指针以及该序列的字节数,在原子表中增加一个该序列的拷贝*/
unsigned long h;
int i;
struct atom *p;
assert(str);
assert(len >= );
for (h = , i = ; i < len; i++) /*查找表算法*/
h = (h<<) + scatter[(unsigned char)str[i]];
h &= NELEMS(buckets)-;
for (p = buckets[h]; p; p = p->link) /*在buckets[h]中查找是否存在str*/
if (len == p->len) {
for (i = ; i < len && p->str[i] == str[i]; )
i++;
if (i == len)
return p->str; /*找到即返回*/
}
p = ALLOC(sizeof (*p) + len + ); /*没找到则新建原子*/
p->len = len;
p->str = (char *)(p + );
if (len > )
memcpy(p->str, str, len);
p->str[len] = '\0';
p->link = buckets[h];
buckets[h] = p;
return p->str;
}
int Atom_length(const char *str) {
struct atom *p;
int i;
assert(str);
for (i = ; i < NELEMS(buckets); i++)
for (p = buckets[i]; p; p = p->link) /*在buckets表中查找str*/
if (p->str == str)
return p->len; /*成功找到后返回len*/
assert();
return ;
}

atom.c

参考资料

《C语言接口与实现--创建可重用软件的技术》

C语言原子接口与实现的更多相关文章

  1. R语言数据接口

    R语言数据接口 R语言处理的数据一般从外部导入,因此需要数据接口来读取各种格式化的数据 CSV # 获得data是一个数据帧 data = read.csv("input.csv" ...

  2. [日常] Go语言圣经--接口约定习题

    Go语言圣经-接口1.接口类型是对其它类型行为的抽象和概括2.Go语言中接口类型的独特之处在于它是满足隐式实现的3.Go语言中还存在着另外一种类型:接口类型.接口类型是一种抽象的类型4.一个类型可以自 ...

  3. FFI (语言交互接口(Foreign Function Interface))

    FFI(Foreign Function Interface)是用来与其它语言交互的接口, 在有些语言里面称为语言绑定(language bindings), Java 里面一般称为 JNI(Java ...

  4. c语言调试接口

    http://blog.chinaunix.net/uid-10106787-id-2985587.html 在C语言程序设计中,常会出现各种各样的bug:段错误.参数异常等等.我们需要尽快定位错误, ...

  5. Java语言Socket接口用法详解

    Socket接口用法详解   在Java中,基于TCP协议实现网络通信的类有两个,在客户端的Socket类和在服务器端的ServerSocket类,ServerSocket类的功能是建立一个Serve ...

  6. C语言/原子/编译,你真的明白了吗?

    说到原子,类似于以下的代码可能人人都可以看出猫腻. #include <stdio.h> #include <pthread.h> ; void* mythread(void* ...

  7. Go语言的接口

    一.接口的定义和好处 我们都知道接口给类提供了一种多态的机制,什么是多态,多态就是系统根据类型的具体实现完成不同的行为. 以下代码简单说明了接口的作用 package main import ( &q ...

  8. go语言学习-接口

    Go语言中虽然没有传统面向对象语言中类.集成的概念,不过提供了接口的支持,可以使用接口来使用一些面向对象的特性. 在 go 语言中,的接口有下面几个特点: 可以包含0个或多个方法的签名 只定义方法的签 ...

  9. Go语言的接口interface、struct和组合、继承

    Go语言的interface概念相对于C++中的基类,通过interface来实现多态功能. 在C++中,当需要实现多态功能时,步骤是首先定义一个基类,该基类使用虚函数或者纯虚函数抽象了所有子类会用到 ...

随机推荐

  1. 实现TabView(页签)效果

    今天花了点时间,设计了一个网页上用的tabview(页签.tabcontrol)效果.个人觉得实现得比较不错,网页元素用得比较少,js代码也比较精练.测试了一下支持IE.FireFox以及chrome ...

  2. HTML5[3]:中文换行

    保证中文每行第一个字,不会出现标点符号 p { white-space: pre-wrap; }

  3. 伸展树(三)之 Java的实现

    概要 前面分别通过C和C++实现了伸展树,本章给出伸展树的Java版本.基本算法和原理都与前两章一样.1. 伸展树的介绍2. 伸展树的Java实现(完整源码)3. 伸展树的Java测试程序 转载请注明 ...

  4. GNOME3任务栏、标题栏过宽问题

    Debian 7.0 默认安装的是GNOME 3.4.2桌面系统,缺省状态下,用户会发现桌面系统的桌面任务栏及标题栏宽度太大,影响美观,同时也浪费屏幕显示的有效宽度,针对这个问题我们可以通过以下方式进 ...

  5. iOS- NSDateFormatter (自定义时间格式)

    一. NSDateFormatter解释 1. 日期(NSDate)是NSString类的格式(stringWithFormat),也可以改变输出,如果需要输出年代信息等则需要进行转换,等等. 2.  ...

  6. Linux磁盘操作命令

    查看本地磁盘使用情况:df或者df -l单位为k 容量便于查看,以1024单位换算为M或者G等:df -h或者df -lh 以1000为单位换算:df -H 显示文件系统类型:df -T 显示指定文件 ...

  7. QCustomplot使用分享(六) 坐标轴和网格线

    一.概述 前边已经写了5篇对QCustomPlot的讲解,看过上述的几篇文章后,基本就能做一些简单的使用了,但是如果想要做到高度的控制图表,那么坐标轴将是很重要的一部分,因为坐标轴就是图表的一个参考系 ...

  8. Python+Selenium进行UI自动化测试项目中,常用的小技巧3:写入excel表(python,xlsxwriter)

    我们在项目中可能用到excel表生成,下面的代码就是对excel表的操作: import xlsxwriter import datetime class write_excel(): def __i ...

  9. IOS学习笔记之 Socket 编程

    最近开始静心学习IOS编程,虽然起步有点晚,但有句话说的好:“如果想去做,任何时候都不晚”.所以在今天,开始好好学习IOS.(本人之前4年都是搞.Net的,java也培训过一年) 打算学IOS,从哪入 ...

  10. [Architect] ABP(现代ASP.NET样板开发框架) 翻译

    所有翻译文档,将上传word文档至GitHub 本节目录: 简介 代码示例 支持的功能 GitHub 简介 ABP是“ASP.NET Boilerplate Project (ASP.NET样板项目) ...