本文的一些基本概念参考了一部分百度百科，当然只保留了最有价值的部分，代码部分完全是自己实现！

简介

哈希表（Hash table，也叫散列表），是根据关键码值(Key value)而直接进行访问的数据结构。它通过把关键码值映射到表中一个位置来访问记录，有点类似于数组，并且能在O(1)（冲突情况另算）下查找到元素。

基本概念

设所有可能出现的关键字集合记为u(简称全集)。实际发生(即实际存储)的关键字集合记为k（|k|比|u|小得多）。|k|是集合k中元素的个数。
散列方法是使用函数hash将u映射到表t[0..m-1]的下标上（m=o(|u|)）。这样以u中关键字为自变量，以h为函数的运算结果就是相应结点的存储地址。从而达到在o(1)时间内就可完成查找。

其中：

① hash：u→{0，1，2，…，m-1} ，通常称h为散列函数(hash function)。散列函数h的作用是压缩待处理的下标范围，使待处理的|u|个值减少到m个值，从而降低空间开销。
② t为散列表(hash table)。
③ hash(ki)(ki∈u)是关键字为ki结点存储地址(亦称散列值或散列地址)。
④ 将结点按其关键字的散列地址存储到散列表中的过程称为散列(hashing).

比如：有一组数据包括用户名字、电话、住址等，为了快速的检索，我们可以利用名字作为关键码，hash规则就是把名字中每一个字的拼音的第一个字母拿出来，把该字母在26个字母中的顺序值取出来加在一块作为该记录的地址。比如张三，就是z+s=26+19=45。就是把张三存在地址为45处。

但是这样存在一个问题，比如假如有个用户名字叫做：周四，那么计算它的地址时也是z+s=45，这样它与张三就有相同的地址，这就是冲突，也叫作碰撞(hash碰撞)。
冲突：两个不同的关键字，由于散列函数值相同，因而被映射到同一表位置上。该现象称为冲突(collision)或碰撞。发生冲突的两个关键字称为该散列函数的同义词(synonym)。

构造方法

散列函数的选择有两条标准：简单和均匀简单指散列函数的计算简单快速；
均匀指对于关键字集合中的任一关键字，散列函数能以等概率将其映射到表空间的任何一个位置上。也就是说，散列函数能将子集k随机均匀地分布在表的地址集{0，1，…，m-1}上，以使冲突最小化。

常用散列函数

（1）直接定址法：比如在一个0～100岁的年龄统计表，我们就可以把年龄作为地址。

（2）平方取中法
具体方法：先通过求关键字的平方值扩大相近数的差别，然后根据表长度取中间的几位数作为散列函数值。又因为一个乘积的中间几位数和乘数的每一位都相关，所以由此产生的散列地址较为均匀。
（3）除留余数法
取关键字被某个不大于哈希表表长m的数p除后所得余数为哈希地址。该方法的关键是选取p。选取的p应使得散列函数值尽可能与关键字的各位相关。p最好为素数。
（4）随机数法
选择一个随机函数，取关键字的随机函数值为它的散列地址，即
h(key)=random(key)
其中random为伪随机函数，但要保证函数值是在0到m-1之间。
处理冲突
处理冲突——假设哈希表的地址集为0~n-1,冲突是指由关键字得到的哈希地址为j(0<=j<=n-1)的位置上已存有记录,则“处理冲突”就是为该关键字的记录找到另一个“空”的哈希地址.
在处理冲突过程中可能得到一个地址序列Hi (i=1,2,…,k),即在处理哈希地址的冲突时,若得到的另一个哈希地址H1仍然发生冲突,则再求下一个地址 H2,若H2仍然冲突,再求得H3.依次类推,直到Hk不发生冲突为止,则Hk为记录在表中的地址.

另外，理想的散列函数满足下面几点：

1、散列函数的输出值尽量接近均匀分布；

2、x的微小变化可以使f(x)发生非常大的变化，即所谓“雪崩效应”(Avalanche effect)；

处理冲突的方法

(1)开放定址法(2)拉链法 (3)建立公共溢出区法
拉链法解决冲突的做法是：将所有关键字为同义词的结点链接在同一个单链表中。若选定的散列表长度为m，则可将散列表定义为一个由m个头指针组成的指针数组t[0..m-1]。凡是散列地址为i的结点，均插入到以t为头指针的单链表中。t中各分量的初值均应为空指针。在拉链法中，装填因子α可以大于1，但一般均取α≤1。

下面是代码实现，已经测试过：

#include <string.h>

#include <stdio.h>

#include <stdlib.h>

typedef struct node{

    char *name;//字段名

    char *desc;//描述

    struct node *next;

}node;

#define HASHSIZE 100 //hash表长度

static node* hashtable[HASHSIZE];//定义一个hash数组，该数组的每个元素是一个hash结点指针,并且由于是全局静态变量,默认初始化为NULL

unsigned int hash(char *s)

{//哈希函数

    unsigned int h=;

    for(;*s;s++)

        h=*s+h*;//将整个字符串按照特定关系转化为一个整数，然后对hash长度取余

    return h%HASHSIZE;

}

node* lookup(char *str)

{

    unsigned int hashvalue = hash(str);

    node* np = hashtable[hashvalue];

    for( ; np!=NULL; np = np->next)

    {//这里是链地址法解决的冲突,返回的是第一个链表结点

        if(!strcmp(np->name, str))//strcmp相等的时候才返回0

            return np;

    }

    return NULL;

}

char* search(char* name)

{//对hash表查找特定元素(元素是字符串）

    node* np=lookup(name);

    if(np==NULL)

        return NULL;

    else

        return np->desc;

}

node* malloc_node(char* name, char* desc)

{//在堆上为结点分配内存，并填充结点

    node *np=(node*)malloc(sizeof(node));

    if(np == NULL)

        return NULL;

    np->name = name;

    np->desc = desc;

    np->next = NULL;

    return np;

}

int insert(char* name, char* desc)

{

    unsigned int hashvalue;

    hashvalue = hash(name);

    //头插法，不管该hash位置有没有其他结点，直接插入结点

    node* np = malloc_node(name, desc);

    if (np == NULL) return ;//分配结点没有成功，则直接返回

    np->next = hashtable[hashvalue];

    hashtable[hashvalue] = np;

    return ;

}

/* A pretty useless but good debugging function,

which simply displays the hashtable in (key.value) pairs

*/

void displayHashTable()

{//显示hash表元素（不包括空）

    node *np;

    unsigned int hashvalue;

    for(int i=; i < HASHSIZE; ++i)

    {

        if(hashtable[i] != NULL)

        {

            np = hashtable[i];

            printf("\nhashvalue: %d (", i);

            for(; np != NULL; np=np->next)

                printf(" (%s.%s) ", np->name, np->desc);

            printf(")\n");

        }

    }

}

void cleanUp()

{//清空hash表

    node *np,*tmp;

    for(int i=;i < HASHSIZE; ++i)

    {

        if(hashtable[i] != NULL)

        {

            np = hashtable[i];

            while(np != NULL)

            {

                tmp = np->next;

                free(np->name);

                free(np->desc);

                free(np);

                np = tmp;

            }

        }

    }

}

int main()

{

    char* names[]={"First Name","Last Name","address","phone","k101","k110"};

    char* descs[]={"Kobe","Bryant","USA","","Value1","Value2"};

    for(int i=; i < ; ++i)

        insert(names[i], descs[i]);

    printf("we should see %s\n",search("k110"));

    insert("phone","");//这里计算的hash是冲突的，为了测试冲突情况下的插入

     printf("we have %s and %s\n",search("k101"),search("phone"));

    displayHashTable();

    cleanUp();

    return ;

}

输出结果：

需要特别注意一下，上面的hash函数计算为29的，用的就是单链表的头插法来解决冲突，不要复杂化了问题！

上面的代码是我自己实现的拉链法版本，后面我还会继续增加一些其他更好的版本，Waiting！

HASH表的实现（拉链法）的更多相关文章

Hash开散列拉链法
#include<iostream> #include<cstdio> using namespace std; const int maxn=1000007; struct ...
PHP数组/Hash表的实现/操作、PHP变量内核实现、PHP常量内核实现 - [ PHP内核学习 ]
catalogue . PHP Hash表 . PHP数组定义 . PHP变量实现 . PHP常量实现 1. PHP Hash表 0x1: 基本概念哈希表在实践中使用的非常广泛,例如编译器通常会维护 ...
拉链法解决Hash节点冲突问题
<?php /* * hash::拉链法解决hash节点存储冲突问题 * ::2014-07-02 * ::Small_Kind */ class small_hash { private $s ...
经典递归问题:0,1背包问题 kmp 用遗传算法来解背包问题，hash表，位图法搜索，最长公共子序列
0,1背包问题:我写笔记风格就是想到哪里写哪里,有很多是旧的也没删除,代码内部可能有很多重复的东西,但是保证能运行出最后效果 '''学点高大上的遗传算法''' '''首先是Np问题的定义: npc:多 ...
第9章：LeetCode--算法：HASH表
哈希表(Hash table,也叫散列表),关键值K和内容的映射表,通过映射函数实现,hashtable(key,value) 进行查询的时候,就是使用哈希函数将关键码key转换为对应的数组下标,并定 ...
hash算法与拉链法解决冲突
<?php class HashNode { public $key; public $value; public $nextNode; public function __construct( ...
线性探测再散列建立HASH表
根据数据元素的关键字和哈希函数建立哈希表并初始化哈希表,用开放定址法处理冲突,按屏幕输出的功能表选择所需的功能实现用哈希表对数据元素的插入,显示,查找,删除. 初始化哈希表时把elem[MAXSIZE ...
Hash表算法
出处:http://blog.csdn.net/v_JULY_v 第一部分:Top K 算法详解问题描述百度面试题: 搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的 ...
深入了解STL中set与hash_set，hash表基础
一,set和hash_set简介在STL中,set是以红黑树(RB-Tree)作为底层数据结构的,hash_set是以哈希表(Hash table)作为底层数据结构的.set可以在时间复杂度为O(l ...

随机推荐

python学习第一天 -----2019年4月15日
第一周-第06章节-Python3.5-第一个python程序 #!/usr/bin/env python #-*- coding:utf-8 _*- """ @auth ...
使用JAX-WS(JWS)发布WebService（一）
JAX-WS概述: 通过Main发布一个简单WebService: JAX-WS(Java API for XML Web Services)规范是一组XML web services的JAVA AP ...
由OpenResty粘合的企业Web架构
前言: 2012年2月章亦春(agentzh)在Tech-Club的一次线下聚会上以<由Lua 粘合的Nginx生态环境>为主题做了演讲,分析了企业Web架构的趋势,即一个看起来完整 ...
20145209 2016-2017-2 《Java程序设计》第10周学习总结
20145209 2016-2017-2 <Java程序设计>第10周学习总结教材学习内容总结计算机网络概述计算机网络体系结构的通信协议划分为七层,自下而上依次为:物理层(Physi ...
python import vs from import
https://stackoverflow.com/questions/9439480/from-import-vs-import
Android性能测试 | 启动时间篇
[转载]原文地址:http://www.51testing.com/html/93/n-3724593.html 背景介绍 Android用户也许会经常碰到以下的问题: 1)应用后台开着,手机很快没电 ...
jmeter属性设置
使用${__setProperty(newuserid,1,)}函数对属性进行设置 2.使用${__P(userid)}函数在其他线程组中引用该属性备注: 1.JMeter属性在测试脚本的任何地方都 ...
lintcode First Unique Number In Stream
First Unique Number In Stream 描述: Given a continuous stream of numbers, write a function that return ...
lr 常用操作
lr脚本编写语法: web_add_cookie();:服务器注入cookies lr_save_string("网址或其他","参数2");:一个保存函数,它 ...
Java进阶知识点：协变与逆变
一.背景要搞懂Java中的协办与逆变,不得不从继承说起,如果没有继承,协变与逆变也天然不存在了. 我们知道,在Java的世界中,存在继承机制.比如MochaCoffee类是Coffee类的派生类,那 ...

HASH表的实现（拉链法）