[译]C语言实现一个简易的Hash table(6)

上一章中，我们实现了Hash表中的插入、搜索和删除接口，我们在初始化hash表时固定了大小为53，为了方便扩展，本章将介绍如何修改hash表的大小。

设置`Hash表`大小

现在，我们的hash表是固定大小(53)的，当插入越来越多数据时，我们的hash表就会被插满，这个问题有两个原因：

哈希表的性能随着高冲突率而降低
我们的'hash表'只能存储固定数量的记录，如果我们存储更多，将无法插入数据

为了减少hash表被插满的情况发生，当插入很多数据时，我们可以增大hash表的大小，hash表中的count属性代表已经插入的数据条数，在每次插入和删除时，我们计算表的“负载”，或插入的数量和总的大小的比率，如果它高于或低于某些值，我们会减小或扩大hash表的大小。

我们定义如下规则：

如果负载>0.7，就扩大
如果负载<0.1，就缩小

要调整大小，我们创建一个大约是当前大小的一半或两倍的新哈希表，并将所有未删除的项插入其中。

我们的新hash表大小应该是大约是当前大小的两倍或一半的素数，找到新的hash表大小并非易事。为了确定hash表的大小，我们现设置一个最基本的大小，然后将实际大小定义为大于基本大小的第一个素数。扩大时，我们先将基本大小加倍，找到第一个更大的素数，然后作为hash表的大小，缩小时，我们将大小减半并找到下一个更大的素数。

我们先从基本大小50开始，我们使用最简单粗暴的方法通过检查每个连续数是否为素数来查找下一个素数。这个简单粗暴的方法看起来不是很理想，但是我们实际需要检查的值很少，并且花费的时间超过了重新散列表中每个项目所花费的时间。

首先，我们先定义一个函数用来找到下一个素数，prime.h和prime.c的内容如下：

// prime.h

int is_prime(const int x);

int next_prime(int x);

// prime.c

#include <math.h>

#include "prime.h"

/*

 * Return whether x is prime or not

 *

 * Returns:

 *   1  - prime

 *   0  - not prime

 *   -1 - undefined (i.e. x < 2)

 */

int is_prime(const int x) {

    if (x < 2) { return -1; }

    if (x < 4) { return 1; }

    if ((x % 2) == 0) { return 0; }

    for (int i = 3; i <= floor(sqrt((double) x)); i += 2) {

        if ((x % i) == 0) {

            return 0;

        }

    }

    return 1;

}

/*

 * Return the next prime after x, or x if x is prime

 */

int next_prime(int x) {

    while (is_prime(x) != 1) {

        x++;

    }

    return x;

}

下一步，我们需要修改ht_new函数，使之可以在创建hash表时指定大小，为此我们要创建一个新的函数ht_new_sized，在ht_new中我们调用ht_new_sized并给我们的hash表一个默认大小：

// hash_table.c

static ht_hash_table* ht_new_sized(const int base_size) {

    ht_hash_table* ht = xmalloc(sizeof(ht_hash_table));

    ht->base_size = base_size;

    ht->size = next_prime(ht->base_size);

    ht->count = 0;

    ht->items = xcalloc((size_t)ht->size, sizeof(ht_item*));

    return ht;

}

ht_hash_table* ht_new() {

    return ht_new_sized(HT_INITIAL_BASE_SIZE);

}

现在一切准备就绪。在我们的设置hash表大小函数中，我们需要检查以确保我们没有将哈希表的大小减小到最小值以下，然后，我们初始化一个所需大小的新hash表，原表中所有非NULL或者未被删除的都会插入到新hash表中，然后我们在删除旧的hash表之前将属性赋值给新的hash表。

// hash_table.c

static void ht_resize(ht_hash_table* ht, const int base_size) {

    if (base_size < HT_INITIAL_BASE_SIZE) {

        return;

    }

    ht_hash_table* new_ht = ht_new_sized(base_size);

    for (int i = 0; i < ht->size; i++) {

        ht_item* item = ht->items[I];

        if (item != NULL && item != &HT_DELETED_ITEM) {

            ht_insert(new_ht, item->key, item->value);

        }

    }

    ht->base_size = new_ht->base_size;

    ht->count = new_ht->count;

    // To delete new_ht, we give it ht's size and items

    const int tmp_size = ht->size;

    ht->size = new_ht->size;

    new_ht->size = tmp_size;

    ht_item** tmp_items = ht->items;

    ht->items = new_ht->items;

    new_ht->items = tmp_items;

    ht_del_hash_table(new_ht);

}

为了简化设置大小，我们定义了两个函数：

// hash_table.c

static void ht_resize_up(ht_hash_table* ht) {

    const int new_size = ht->base_size * 2;

    ht_resize(ht, new_size);

}

static void ht_resize_down(ht_hash_table* ht) {

    const int new_size = ht->base_size / 2;

    ht_resize(ht, new_size);

}

要执行调整大小，我们先检查插入和删除时hash表上的负载。如果它高于或低于0.7和0.1的预定义限制，我们分别调高或调低。

为了避免进行浮点运算，我们将计数乘以100，并检查它是高于还是低于70或10：

// hash_table.c

void ht_insert(ht_hash_table* ht, const char* key, const char* value) {

    const int load = ht->count * 100 / ht->size;

    if (load > 70) {

        ht_resize_up(ht);

    }

    // ...

}

void ht_delete(ht_hash_table* ht, const char* key) {

    const int load = ht->count * 100 / ht->size;

    if (load < 10) {

        ht_resize_down(ht);

    }

    // ...

}

上一章：实现接口

下一章：附录：替代碰撞处理

原文地址：https://github.com/jamesroutley/write-a-hash-table/tree/master/06-resizing

[译]C语言实现一个简易的Hash table(6)的更多相关文章

[译]C语言实现一个简易的Hash table(4)
上一章我们解释了Hash table中最重要的hash函数,并用伪代码和C语言实现了一个我们自己的hash函数,hash函数中碰撞是无法避免的,当发生碰撞时我们改如何有效的处理呢?这章我们就来讲解下. ...
[译]C语言实现一个简易的Hash table(1)
说明 Hash table翻译过来就是Hash表,是一种提供了类似于关联数组的数据结构,可以通过key执行搜索.插入和删除操作.Hash表由一些列桶(buckets)组成,而每一个bucket都是由k ...
[译]C语言实现一个简易的Hash table(3)
上一章,我们讲了hash表的数据结构,并简单实现了hash表的初始化与删除操作,这一章我们会讲解Hash函数和实现算法,并手动实现一个Hash函数. Hash函数本教程中我们实现的Hash函数将会实 ...
[译]C语言实现一个简易的Hash table(2)
上一章,简单介绍了Hash Table,并提出了本教程中要实现的几个Hash Table的方法,有search(a, k).insert(a, k, v)和delete(a, k),本章将介绍Hash ...
[译]C语言实现一个简易的Hash table(5)
上一章中,我们使用了双重Hash的技术来处理碰撞,并用了C语言实现,贲张我们将实现Hash表中的插入.搜索和删除接口. 实现接口我们的hash函数将会实现如下的接口: // hash_table.h ...
[译]C语言实现一个简易的Hash table(7)
上一章我们讲了如何根据需要动态设置hash表的大小,在第四章中,我们使用了双重哈希来解决hash表的碰撞,其实解决方法有很多,这一章我们来介绍下其他方法. 本章将介绍两种解决hash表碰撞的方法: 拉 ...
用Java语言编写一个简易画板
讲了三篇概博客的概念,今天,我们来一点实际的东西.我们来探讨一下如何用Java语言,编写一块简易的画图板. 一.需求分析无论我们使用什么语言,去编写一个什么样的项目,我们的第一步,总是去分析这个项目 ...
用java语言写一个简易版本的登录页面，包含用户注册、用户登录、用户注销、修改密码等功能
package com.Summer_0421.cn; import java.util.Arrays; import java.util.Scanner; /** * @author Summer ...
PHP内核探索之变量（3）- hash table
在PHP中,除了zval, 另一个比较重要的数据结构非hash table莫属,例如我们最常见的数组,在底层便是hash table.除了数组,在线程安全(TSRM).GC.资源管理.Global变量 ...

随机推荐

[翻译] DXPopover
DXPopover A Popover mimic Facebook app popover using UIKit. 使用UIKit框架写了一个类似于Facebook的pop效果的动画. The c ...
Python学习---Django的基础学习
django实现流程 Django学习框架: #安装: pip3 install django 添加环境变量 #1 创建project django-ad ...
Linux 下Shell的学习3-优秀demo
优秀的DEMO cat /etc/init.d/functions -->里面有颜色定义cat /etc/rc.d/rc.sysinit cat /etc/init.d/nfscat /et ...
Win10离线安装.NET Framework 3.5的方法技巧（附离线安装包下载）
原文链接: https://www.windows10.pro/win10-net-framework-3-5/ 在Windows10中,当我们安装某些软件的时候会提示“你的电脑上的应用需要使用以下W ...
Web Service超限
问题现状: {System.ServiceModel.CommunicationException: An error occurred while receiving the HTTP respon ...
iOS亮屏解锁命令【iOS自动化测试】--使用ssh
前提:iOS越狱手机一个越狱方法:使用pp助手, 爱思助手等 1.从Cydia安装以下软件: AppSync for iOSx(可安装破解软件).afc2add补丁(可访问整个iOS设备的系统文件) ...
JavaScript的DOM_操作行内样式
一.检测浏览器是否支持css CSS 作为(X)HTML 的辅助,可以增强页面的显示效果.但不是每个浏览器都能支持最新的 CSS 能力.CSS 的能力和 DOM 级别密切相关,所以我们有必要检测当前浏 ...
用Qt制作的Android独立游戏《吃药了》公布
一个多月的努力最终有了回报,我自己研究制作的独立游戏<吃药了>.最终在360应用商店上线了. 这一款游戏呢.使用的是Qt开发的.事实上开发这款简单的应用之前.我 ...
2018-2019-2 网络对抗技术 20165322 Exp4 恶意代码分析
2018-2019-2 网络对抗技术 20165322 Exp4 恶意代码分析目录实验内容与步骤系统运行监控恶意软件分析实验过程中遇到的问题基础问题回答实验总结与体会实验内容与步骤系 ...
使用python编写svn钩子
同上一篇trac中安装插件的文章的出发点一样,感觉用文档和口头制定规则在执行上会有偏差并且需要经常引导新人去熟悉规则. 所以,又费了几个小时去琢磨怎么改进svn提交代码的钩子,现有的钩子的功能比较简单 ...

[译]C语言实现一个简易的Hash table(6)

设置Hash表大小

[译]C语言实现一个简易的Hash table(6)的更多相关文章

随机推荐

热门专题

设置`Hash表`大小