计算二进制形式中1的数量这种问题,在各种刷题网站上比较常见,以往都是选择最笨的遍历方法“蒙混”过关.在了解Redis的过程中接触到了variable precision SWAR算法(以下简称VP-SWAR算法),算法异常简洁,是目前已知的同类方法中最快的.但如果对于位运算不是很熟悉的话,却不一定容易理解,所以有必要记录一下. 下面先看看VP-SWAR算法的完整实现,然后再逐行解释. public int vpSWAR(int i){ i = (i & 0x55555555) + ((i>&…
variable-precision SWAR算法:计算Hamming Weight 转自我的Github 最近看书看到了一个计算Hamming Weight的算法,觉得挺巧妙的,纪录一下. Hamming Weight,即汉明重量,指的是一个位数组中非0二进制位的数量. 对于这个问题,最直观的算法就是遍历二进制位,时间复杂度是O(n),每次需要遍历n个位.另外一个算法是查表,用一个数组记录下一定位数每个数值的汉明重量如:数组hwTable=[0, 1, 1, 2]纪录了0, 1, 2, 3的汉…
BITCOUNT命令是统计一个位数组中非0进制位的数量,数学上称作:”Hanmming Weight“ 目前效率最好的为variable-precision SWAR算法,可以常数时间内计算出多个字节的非0数目,算法设计的非常精巧,值得学习. int swar(uint32_t i) { // (A) i = ( i & ) & 0x55555555); // (B) i = (i & ) & 0x33333333); // (C) i = (i & ) &…
看代码时遇到一个求32bit二进制数中1的个数的问题,感觉算法很奇妙,特记录学习心得于此,备忘. 计算一个64bit二进制数中1的个数. 解决这个问题的算法不难,很自然就可以想到,但是要给出问题的最优解,却很有难度. 通常,最容易想到的算法是除余法,继而考虑到除法的代价较高,而且除数是2,会想到使用向右移位来代替除法,并使用&0x1操作来取末位的值,这样提高了算法的效率.然而,这样仍然进行了63次&操作.63次移位操作和63次+操作.若假设字长大小不限,记作N,那么上述算法的时间复杂度都为…
1.问题来源 之所以来记录这个问题的解法,是因为在在线编程中经常遇到,比如编程之美和京东的校招笔试以及很多其他公司都累此不疲的出这个考题.看似简单的问题,背后却隐藏着很多精妙的解法.查找网上资料,才知道这个问题的正式的名字叫Hamming weight(汉明重量). 2.问题描述 对于一个无符号整型数,求其二进制表示中1的个数.比如12的以32位无符号整型来表示,其二进制为:00000000 00000000 00000000 00001100,那么12的二进制中1的个数是两个. 3.具体解法…
苏君君出了一道题,是牛客网上面的: 输入一个int型整数,输出该数二进制表示中1的个数.其中负数用补码表示. 其实这道题并不难,大家很容易想到的解法是转成字符串的思路,即如下所示: public static int NumberOf1(int n) { String s = Integer.toBinaryString(n); int count = 0; for (int i = 0; i < s.length(); i++) { if(s.charAt(i) == '1'){ count+…
说明:參考Mahout FP算法相关相关源代码. 算法project能够在FP关联规则计算置信度下载:(仅仅是单机版的实现,并没有MapReduce的代码) 使用FP关联规则算法计算置信度基于以下的思路: 1. 首先使用原始的FP树关联规则挖掘出全部的频繁项集及其支持度:这里须要注意,这里是输出全部的频繁项集,并没有把频繁项集合并,所以须要改动FP树的相关代码,在某些步骤把全部的频繁项集输出:(ps:參考Mahout的FP树单机版的实现,进行了改动,暂不确定是否已经输出了全部频繁项集) 为举例简…
Kmeans算是是聚类中的经典算法.步骤例如以下: 选择K个点作为初始质心 repeat 将每一个点指派到近期的质心,形成K个簇 又一次计算每一个簇的质心 until 簇不发生变化或达到最大迭代次数 算法中的K须要人为的指定.确定K的做法有非常多,比方多次进行试探.计算误差.得出最好的K.这样须要比較长的时间.我们能够依据Canopy算法来粗略确定K值(能够觉得相等).看一下Canopy算法的过程: (1)设样本集合为S.确定两个阈值t1和t2,且t1>t2. (2)任取一个样本点p.作为一个C…
分类模型的F1分值.Precision和Recall 计算过程 引入 通常,我们在评价classifier的性能时使用的是accuracy 考虑在多类分类的背景下 accuracy = (分类正确的样本个数) / (分类的所有样本个数) 这样做其实看上去也挺不错的,不过可能会出现一个很严重的问题:例如某一个不透明的袋子里面装了1000台手机,其中有600台iphone6, 300台galaxy s6, 50台华为mate7,50台mx4(当然,这些信息分类器是不知道的...).如果分类器只是简单…
这里主要先介绍如何利用CORDIC算法计算固定角度\(\phi\)的\(cos(\phi)\).\(sin(\phi)\)值.参考了这两篇文章[1].[2]. 一般利用MATLAB计算三角函数时,用\(cos\)举例,只需要输入相应的\(cos(\phi)\)便自动计算出来了.但是如果是硬件处理或者没有那么方便的函数时,该如何计算\(cos(\phi)\)的值呢? 有一种最傻瓜的方式是用rom存储\(0^o\)到\(90^o\)所有的余弦值,然后用查表的方法计算,但随着精度要求的提升,需要存储的…