Go的map是一种高效的数据结构,用于存储键值对。其底层实现是一个哈希表(hash table),下面是有关map底层实现的详细介绍:

  1. 哈希表

    • map的底层实现是一个哈希表,也称为散列表。哈希表是一个数组,其中每个元素被称为"桶",用于存储键值对。
    • 哈希表的大小是可动态调整的,当存储的键值对数量达到一定阈值时,哈希表会进行扩容,以确保性能继续优化。
  2. 哈希函数
    • 哈希表的实现依赖于哈希函数,它将键映射为整数,用于确定存储位置。
    • Go使用一种称为MurmurHash的哈希函数来计算键的哈希值。
    • 哈希函数的设计很重要,它应该能够均匀分布键值对,以减少哈希冲突的可能性。
  3. 散列冲突处理
    • 哈希表中的散列冲突是指多个键具有相同的哈希值,但不同的键值。
    • Go的map实现使用链地址法(Separate Chaining)来处理散列冲突。每个桶可以包含一个链表(或其他数据结构),用于存储多个键值对。
    • 当发生冲突时,新的键值对将被添加到链表中,而不会覆盖已经存在的键值对。
  4. 动态扩容
    • 哈希表在创建时具有固定数量的桶,但随着键值对的增加,它可能会变得满了。
    • Go的map实现会在特定条件下(负载因子达到一定阈值)执行动态扩容。这会创建一个更大的哈希表,重新计算每个键的哈希值,并重新分配存储位置。
    • 动态扩容确保map的性能能够随着键值对数量的增加而保持稳定。
  5. 性能特点
    • Go的map实现具有O(1)的平均时间复杂度,因为哈希表的键查找速度非常快。
    • 但需要注意,map的性能仍然取决于合理的哈希函数选择和键的均匀分布,因为哈希冲突可能会导致性能下降。
  6. 并发安全
    • 在Go 1.9版本之前,map在并发操作中不是安全的,需要开发者自己实现并发保护机制。从Go 1.9版本开始,Go引入了sync.Map,它是并发安全的map的替代品。

Go的map是一种高效的键值对存储数据结构,其底层实现是一个哈希表,包括哈希函数、散列冲突处理、动态扩容等机制,以提供快速的键查找操作。然而,开发者应该理解并注意合理的哈希函数选择和哈希冲突的影响,以确保map的性能。如果需要并发安全的map,可以考虑使用sync.Map

扩展1:MurmurHash

MurmurHash是一种非加密型的哈希函数,主要用于计算数据的哈希值。它被设计用于高性能哈希表和散列数据结构,具有以下特点:

  1. 高性能:MurmurHash以其快速的计算速度而闻名,通常比一些传统的哈希函数快得多。这使得它非常适合用于计算大量数据的哈希值,例如在哈希表、散列表、数据校验和其他应用中。
  2. 均匀分布:MurmurHash被设计为均匀分布哈希函数,这意味着它可以将输入数据均匀地映射到不同的哈希值范围。这有助于减少哈希冲突的概率,即不同的输入数据得到相同的哈希值的概率较低。
  3. 良好的随机性:MurmurHash的输出哈希值在统计学上被认为是具有良好的随机性的,这使得它适用于多种应用,包括散列数据、随机数生成等。
  4. 简单:MurmurHash的算法相对简单,它使用了位运算、位移和混洗操作,而不涉及复杂的数学运算或大量的内存访问。
  5. 可配置性:MurmurHash具有一些可配置的参数,例如种子(seed)值,使用户能够控制哈希函数的输出。
  6. 非加密型:MurmurHash是一种非加密型哈希函数,不适合用于加密或安全散列。它的主要优势在于速度和均匀分布,而不是安全性。

MurmurHash有多个变种,包括MurmurHash1、MurmurHash2、MurmurHash3等,它们在实现细节和性能上有所不同。MurmurHash3是最常见的版本,也是Go语言的mapstring哈希函数的默认实现。

扩展2:Separate Chaining

Separate Chaining(分离链接)是一种用于解决哈希冲突的方法,通常应用于哈希表(散列表)的实现中。当多个键映射到同一个哈希桶时,Separate Chaining 使用每个桶内的数据结构来存储具有相同哈希值的键值对,以避免冲突。

以下是关于Separate Chaining的详细介绍:

  1. 哈希表结构

    • Separate Chaining 使用一个数组来表示哈希表,这个数组的每个元素通常被称为哈希桶。
    • 每个哈希桶内都可以包含一个数据结构,例如链表或动态数组,用于存储具有相同哈希值的键值对。
    • 当键映射到某个哈希桶时,Separate Chaining会将该键值对添加到哈希桶内的数据结构中。
  2. 处理哈希冲突
    • 当多个键具有相同哈希值时,它们将被添加到相同哈希桶中。这会导致哈希冲突。
    • Separate Chaining 的策略是在哈希桶内使用数据结构,以存储所有的键值对。这意味着同一个哈希桶可以包含多个键值对。
    • 当进行查找或插入操作时,Separate Chaining会遍历哈希桶内的数据结构,以找到或添加相应的键值对。
  3. 性能特点
    • Separate Chaining是一种简单而有效的哈希冲突解决方法,特别适用于处理哈希冲突较少的情况。
    • 由于每个哈希桶内的数据结构是独立的,这意味着在不同的哈希桶上的操作通常不会相互影响,提供了较好的并发性能。
    • 性能与数据结构的选择和哈希函数的质量密切相关。
  4. 数据结构选择
    • Separate Chaining 可以使用多种数据结构,例如链表、动态数组、红黑树等,来存储同一个哈希桶内的键值对。
    • 数据结构的选择取决于哈希表的具体实现和性能需求。
    • 例如,链表适用于小型哈希桶,而红黑树适用于大型哈希桶,因为它们提供了更好的查找性能。

声明:本作品采用署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)进行许可,使用时请注明出处。

Author: mengbin

blog: mengbin

Github: mengbin92

cnblogs: 恋水无意


Golang Map底层实现简述的更多相关文章

  1. Golang的标准命令简述

    Golang的标准命令简述 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. Go本身包含了大量用于处理Go程序的命令和工具.go命令就是其中最常见的一个,它有许多子命令,接下来就跟随 ...

  2. 【GoLang】GoLang map 非线程安全 & 并发度写优化

    Catena (时序存储引擎)中有一个函数的实现备受争议,它从 map 中根据指定的 name 获取一个 metricSource.每一次插入操作都会至少调用一次这个函数,现实场景中该函数调用更是频繁 ...

  3. stl map底层之红黑树插入步骤详解与代码实现

    转载注明出处:http://blog.csdn.net/mxway/article/details/29216199 本篇文章并没有详细的讲解红黑树各方面的知识,只是以图形的方式对红黑树插入节点需要进 ...

  4. golang map输出排序

    由于GoLang Map 内部存储是无序的,当需要按顺序获得map存储的key -value值时,应该对遍历出来的结果进行重新排序: 在go 1.8版本后,提供的slice sort 功能使排序更简单 ...

  5. Golang Map实现(一)

    本文学习 Golang 的 Map 数据结构,以及map buckets 的数据组织结构. hash 表是什么 从大学的课本里面,我们学到:hash 表其实就是将key 通过hash算法映射到数组的某 ...

  6. Golang Map实现(四) map 的赋值和扩容

    title: Golang Map 实现 (四) date: 2020-04-28 18:20:30 tags: golang map 操作,是map 实现中较复杂的逻辑.因为当赋值时,为了减少has ...

  7. golang map实现原理

    这篇文章主要讲 map 的赋值.删除.查询.扩容的具体执行过程,仍然是从底层的角度展开.结合源码,看完本文一定会彻底明白 map 底层原理. 我要说明的是,这里对 map 的基本用法涉及比较少,我相信 ...

  8. Golang map 如何进行删除操作?

    Cyeam 关注 2017.11.02 10:02* 字数 372 阅读 2784评论 0喜欢 3 map 的删除操作 Golang 内置了哈希表,总体上是使用哈希链表实现的,如果出现哈希冲突,就把冲 ...

  9. 你不知道的Golang map

    在开发过程中,map是必不可少的数据结构,在Golang中,使用map或多或少会遇到与其他语言不一样的体验,比如访问不存在的元素会返回其类型的空值.map的大小究竟是多少,为什么会报"can ...

  10. golang map getkeys

    golang 获取map的keys package main import "fmt" import "reflect" func main() { abc : ...

随机推荐

  1. 字节跳动开源数据集成引擎 BitSail 的演进历程与能力解析

    导读 BitSail 是字节跳动开源数据集成引擎,支持多种异构数据源间的数据同步,并提供离线.实时.全量.增量场景下全域数据集成解决方案,目前支撑了字节内部和火山引擎多个客户的数据集成需求.经过字节跳 ...

  2. Mac 向日葵设置

  3. MySQL 项目中 SQL 脚本更新、升级方式,防止多次重复执行

    一套代码,多家部署时,在SQL脚本升级时,通过一个SQL文件给运维,避免出现SQL执行序顺出错及漏执行SQL SQL Server 项目中 SQL 脚本更新方式 Oracle 项目中 SQL 脚本更新 ...

  4. Spark面试题(六)——Spark资源调优

    Spark系列面试题 Spark面试题(一) Spark面试题(二) Spark面试题(三) Spark面试题(四) Spark面试题(五)--数据倾斜调优 Spark面试题(六)--Spark资源调 ...

  5. C++20 | std::span 陣列、容器的代理人

    在 C++ 裡頭有相當多「容器」.從原生的陣列,到標準庫 STL 的 vector, array, list, queue, map, set, -.有時候我們只是想以檢視的角度去看一個容器,或是其中 ...

  6. L2-029 特立独行的幸福 (25分) (简单循环 + 素数筛)

    对一个十进制数的各位数字做一次平方和,称作一次迭代.如果一个十进制数能通过若干次迭代得到 1,就称该数为幸福数.1 是一个幸福数.此外,例如 19 经过 1 次迭代得到 82,2 次迭代后得到 68, ...

  7. 如何在 Debian 12 上安装 MariaDB

    MariaDB 是一个开源多线程的关系数据库管理系统,是 MySQL 的替代品. MariaDB 是 Debian 中 MySQL 的默认替换方案. 本教程介绍如何在 Debian 12 上安装 Ma ...

  8. uni-app打包到安卓步骤

    1.打包到安卓 https://www.bilibili.com/video/BV1BJ411W7pX?p=56 2.打包到IOS https://www.jianshu.com/p/ef6e6e01 ...

  9. 彻底解决 gcr、quay、DockerHub 镜像下载难题

    在使用 Docker 和 Kubernetes 时,我们经常需要访问 gcr.io 和 quay.io 镜像仓库,由于众所周知的原因,这些镜像仓库在中国都无法访问,唯一能访问的是 Docker Hub ...

  10. C#绘制柱形图

    柱形图数据 通过 panel 绘制柱形图 private void ShowPic() { Conn(); //打开数据库连接 using (cmd = new SqlCommand("SE ...