各种hash函数
public class HashAlgorithms
{
/**
* 加法hash
* @param key 字符串
* @param prime 一个质数
* @return hash结果
*/
public static int additiveHash(String key, int prime)
{
int hash, i;
for (hash = key.length(), i = ; i < key.length(); i++)
hash += key.charAt(i);
return (hash % prime);
} /**
* 旋转hash
* @param key 输入字符串
* @param prime 质数
* @return hash值
*/
public static int rotatingHash(String key, int prime)
{
int hash, i;
for (hash=key.length(), i=; i<key.length(); ++i)
hash = (hash<<)^(hash>>)^key.charAt(i);
return (hash % prime);
// return (hash ^ (hash>>10) ^ (hash>>20));
} // 替代:
// 使用:hash = (hash ^ (hash>>10) ^ (hash>>20)) & mask;
// 替代:hash %= prime; /**
* MASK值,随便找一个值,最好是质数
*/
static int M_MASK = 0x8765fed1;
/**
* 一次一个hash
* @param key 输入字符串
* @return 输出hash值
*/
public static int oneByOneHash(String key)
{
int hash, i;
for (hash=, i=; i<key.length(); ++i)
{
hash += key.charAt(i);
hash += (hash << );
hash ^= (hash >> );
}
hash += (hash << );
hash ^= (hash >> );
hash += (hash << );
// return (hash & M_MASK);
return hash;
} /**
* Bernstein's hash
* @param key 输入字节数组
* @param level 初始hash常量
* @return 结果hash
*/
public static int bernstein(String key)
{
int hash = ;
int i;
for (i=; i<key.length(); ++i) hash = *hash + key.charAt(i);
return hash;
} //
//// Pearson's Hash
// char pearson(char[]key, ub4 len, char tab[256])
// {
// char hash;
// ub4 i;
// for (hash=len, i=0; i<len; ++i)
// hash=tab[hash^key[i]];
// return (hash);
// } //// CRC Hashing,计算crc,具体代码见其他
// ub4 crc(char *key, ub4 len, ub4 mask, ub4 tab[256])
// {
// ub4 hash, i;
// for (hash=len, i=0; i<len; ++i)
// hash = (hash >> 8) ^ tab[(hash & 0xff) ^ key[i]];
// return (hash & mask);
// } /**
* Universal Hashing
*/
public static int universal(char[]key, int mask, int[] tab)
{
int hash = key.length, i, len = key.length;
for (i=; i<(len<<); i+=)
{
char k = key[i>>];
if ((k&0x01) == ) hash ^= tab[i+];
if ((k&0x02) == ) hash ^= tab[i+];
if ((k&0x04) == ) hash ^= tab[i+];
if ((k&0x08) == ) hash ^= tab[i+];
if ((k&0x10) == ) hash ^= tab[i+];
if ((k&0x20) == ) hash ^= tab[i+];
if ((k&0x40) == ) hash ^= tab[i+];
if ((k&0x80) == ) hash ^= tab[i+];
}
return (hash & mask);
} /**
* Zobrist Hashing
*/
public static int zobrist( char[] key,int mask, int[][] tab)
{
int hash, i;
for (hash=key.length, i=; i<key.length; ++i)
hash ^= tab[i][key[i]];
return (hash & mask);
} // LOOKUP3
// 见Bob Jenkins(3).c文件 // 32位FNV算法
static int M_SHIFT = ;
/**
* 32位的FNV算法
* @param data 数组
* @return int值
*/
public static int FNVHash(byte[] data)
{
int hash = (int)2166136261L;
for(byte b : data)
hash = (hash * ) ^ b;
if (M_SHIFT == )
return hash;
return (hash ^ (hash >> M_SHIFT)) & M_MASK;
}
/**
* 改进的32位FNV算法1
* @param data 数组
* @return int值
*/
public static int FNVHash1(byte[] data)
{
final int p = ;
int hash = (int)2166136261L;
for(byte b:data)
hash = (hash ^ b) * p;
hash += hash << ;
hash ^= hash >> ;
hash += hash << ;
hash ^= hash >> ;
hash += hash << ;
return hash;
}
/**
* 改进的32位FNV算法1
* @param data 字符串
* @return int值
*/
public static int FNVHash1(String data)
{
final int p = ;
int hash = (int)2166136261L;
for(int i=;i<data.length();i++)
hash = (hash ^ data.charAt(i)) * p;
hash += hash << ;
hash ^= hash >> ;
hash += hash << ;
hash ^= hash >> ;
hash += hash << ;
return hash;
} /**
* Thomas Wang的算法,整数hash
*/
public static int intHash(int key)
{
key += ~(key << );
key ^= (key >>> );
key += (key << );
key ^= (key >>> );
key += ~(key << );
key ^= (key >>> );
return key;
}
/**
* RS算法hash
* @param str 字符串
*/
public static int RSHash(String str)
{
int b = ;
int a = ;
int hash = ; for(int i = ; i < str.length(); i++)
{
hash = hash * a + str.charAt(i);
a = a * b;
} return (hash & 0x7FFFFFFF);
}
/* End Of RS Hash Function */ /**
* JS算法
*/
public static int JSHash(String str)
{
int hash = ; for(int i = ; i < str.length(); i++)
{
hash ^= ((hash << ) + str.charAt(i) + (hash >> ));
} return (hash & 0x7FFFFFFF);
}
/* End Of JS Hash Function */ /**
* PJW算法
*/
public static int PJWHash(String str)
{
int BitsInUnsignedInt = ;
int ThreeQuarters = (BitsInUnsignedInt * ) / ;
int OneEighth = BitsInUnsignedInt / ;
int HighBits = 0xFFFFFFFF << (BitsInUnsignedInt - OneEighth);
int hash = ;
int test = ; for(int i = ; i < str.length();i++)
{
hash = (hash << OneEighth) + str.charAt(i); if((test = hash & HighBits) != )
{
hash = (( hash ^ (test >> ThreeQuarters)) & (~HighBits));
}
} return (hash & 0x7FFFFFFF);
}
/* End Of P. J. Weinberger Hash Function */ /**
* ELF算法
*/
public static int ELFHash(String str)
{
int hash = ;
int x = ; for(int i = ; i < str.length(); i++)
{
hash = (hash << ) + str.charAt(i);
if((x = (int)(hash & 0xF0000000L)) != )
{
hash ^= (x >> );
hash &= ~x;
}
} return (hash & 0x7FFFFFFF);
}
/* End Of ELF Hash Function */ /**
* BKDR算法
*/
public static int BKDRHash(String str)
{
int seed = ; // 31 131 1313 13131 131313 etc..
int hash = ; for(int i = ; i < str.length(); i++)
{
hash = (hash * seed) + str.charAt(i);
} return (hash & 0x7FFFFFFF);
}
/* End Of BKDR Hash Function */ /**
* SDBM算法
*/
public static int SDBMHash(String str)
{
int hash = ; for(int i = ; i < str.length(); i++)
{
hash = str.charAt(i) + (hash << ) + (hash << ) - hash;
} return (hash & 0x7FFFFFFF);
}
/* End Of SDBM Hash Function */ /**
* DJB算法
*/
public static int DJBHash(String str)
{
int hash = ; for(int i = ; i < str.length(); i++)
{
hash = ((hash << ) + hash) + str.charAt(i);
} return (hash & 0x7FFFFFFF);
}
/* End Of DJB Hash Function */ /**
* DEK算法
*/
public static int DEKHash(String str)
{
int hash = str.length(); for(int i = ; i < str.length(); i++)
{
hash = ((hash << ) ^ (hash >> )) ^ str.charAt(i);
} return (hash & 0x7FFFFFFF);
}
各种hash函数的实现
其中比较有名的是elfhash函数。它对字串数组的算hash方式为
将一个字符串的数组中的每个元素依次按前四位与上一个元素的低四位相与,组成一个长整形,如果长整的高四位大于零,那么就将它折回再与长整的低四位相异或,这样最后得到的长整对HASH表长取余,得到在HASH中的位置。
/**
* ELF算法
*/
public static int ELFHash(String str)
{
int hash = ;
int x = ; for(int i = ; i < str.length(); i++)
{
hash = (hash << ) + str.charAt(i);
if((x = (int)(hash & 0xF0000000L)) != )
{
hash ^= (x >> );
hash &= ~x;
}
}
}
下面这个是所有最靠近2的幂次方的质数表,这些质数可以用来做hash表的扩增
glib质数表 static const gint prime_mod [] =
{
, /* For 1 << 0 */
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
, /* For 1 << 16 */
,
,
,
,
,
,
,
,
,
,
,
,
,
,
/* For 1 << 31 */
};
各种hash函数的更多相关文章
- Hash 函数及其重要性
不时会爆出网站的服务器和数据库被盗取,考虑到这点,就要确保用户一些敏感数据(例如密码)的安全性.今天,我们要学的是 hash 背后的基础知识,以及如何用它来保护你的 web 应用的密码. 申明 密码学 ...
- Bitset<>用于unordered container时的默认hash函数
自从c++11起,bitset用于unordered container,将会提供默认的hash函数. 在gcc中,相关代码如下: // DR 1182. /// std::hash speciali ...
- Hash函数及其应用
本文部分内容摘自网络,参考资料链接会在文后给出,在此感谢原作者的分享. 计算理论中,没有Hash函数的说法,只有单向函数的说法.所谓的单向函数,是一个复杂的定义,大家可以去看计算理论或者密码学方面的数 ...
- 各种字符串Hash函数比较(转)
常用的字符串Hash函数还有ELFHash,APHash等等,都是十分简单有效的方法.这些函数使用位运算使得每一个字符都对最后的函数值产生影响.另外还有以MD5和SHA1为代表的杂凑函数,这些函数几乎 ...
- hash函数为什么要选择对素数求余?
常用的hash函数是选一个数m取模(余数),这个数在课本中推荐m是素数,但是经常见到选择m=2^n,因为对2^n求余数更快,并认为在key分布均匀的情况下,key%m也是在[0,m-1]区间均匀分布的 ...
- 理解php Hash函数,增强密码安全
1.声明 密码学是一个复杂的话题,我也不是这方面的专家.许多高校和研究机构在这方面都有长期的研究.在这篇文章里,我希望尽量使用简单易懂的方式向你展示一种安全存储Web程序密码的方法. 2.“Hash” ...
- 长度有限制的字符串hash函数
长度有限制的字符串hash函数 DJBHash是一种非常流行的算法,俗称"Times33"算法.Times33的算法很简单,就是不断的乘33,原型如下 hash(i) = hash ...
- [转]各种字符串Hash函数比较
转自:https://www.byvoid.com/zht/blog/string-hash-compare 常用的字符串Hash函数还有ELFHash,APHash等等,都是十分简单有效的方法.这些 ...
- 学习hash_map从而了解如何写stl里面的hash函数和equal或者compare函数
---恢复内容开始--- 看到同事用unordered_map了所以找个帖子学习学习 http://blog.sina.com.cn/s/blog_4c98b9600100audq.html (一)为 ...
- Hash函数的安全性
我们为了保证消息的完整性,引进了散列函数,那么散列函数会对安全正造成什么影响呢?这是需要好好研究一番的问题. 三个概念: 1.如果y<>x,且h(x)=h(y),则称为碰撞. 2.对于给定 ...
随机推荐
- k8s内核参数调优
cat /etc/sysctl.conf kernel.core_uses_pid=1 kernel.pid_max=4194303 kernel.ctrl-alt-del=1 # kernel.co ...
- HDUOJ-----1541 Stars
Stars Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) Total Subm ...
- Bugtags 让你的 APP 测试轻松、上线安心
Bug 管理系统再进化 Bugtags 的创业团队,在过去几年,做了很多方向的尝试——没错,是开发了很多 APP. 每一轮迭代,都会被繁琐的 APP 测试困扰:无休止的截屏上传电脑,无数次的开发与测试 ...
- 【LeetCode】135. Candy
Candy There are N children standing in a line. Each child is assigned a rating value. You are giving ...
- 批量修改Java类文件中引入的package包路径
http://libeey.blogbus.com/logs/101848958.html当复制其他工程中的包到新工程的目录中时,由于包路径不同,出现红叉,下面的类要一个一个修改包路径,类文件太多的话 ...
- RHEL7 -- systemd
systemd 在RHEL7中,进程ID 1属于systemd这个新的进程.(代替之前版本中的init) systemd提供了以下新功能: ·并行化功能,可以提高系统的启动速度 ·按需启动守护进程,而 ...
- jdbc与odbc的差别,感悟,学习。。。
什么是JDBC? JDBC, 全称为Java DataBase Connectivity standard, 它是一个面向对象的应用程序接口(API), 通过它可訪问各类关系数据库.JDBC也是jav ...
- Nginx 的线程池与性能剖析【转载】
正如我们所知,NGINX采用了异步.事件驱动的方法来处理连接.这种处理方式无需(像使用传统架构的服务器一样)为每个请求创建额外的专用进程或者线程,而是在一个工作进程中处理多个连接和请求.为此,NGIN ...
- 通向码农的道路(enet开源翻译计划 二)
QQ 324186207群 enet交流技术,主要是为了研究tcp内部执行机制.欢迎大家增加探讨.小弟水平有限,翻译难免有误. . http://enet.bespin.org 解析enet 双向链表 ...
- C# 基础知识 (四).C#简单介绍及托管代码
暑假转瞬即逝,从10天的支教生活到1周的江浙沪旅游,在这个漫长的暑假中我经历了非常多东西,也学到了非常多东西,也认识到了非常多不足之处!闲暇之余我准备又一次进一步巩固C#相关知识,包含 ...