平方根的C语言实现(三) —

　　版权申明：本文为博主窗户(Colin Cai)原创，欢迎转帖。如要转贴，必须注明原文网址

　　http://www.cnblogs.com/Colin-Cai/p/7223254.html 

　　作者：窗户

　　QQ：6679072

　　E-mail：6679072@qq.com

　　了解了浮点数的存储以及手算平方根的原理，我们可以考虑程序实现了。

　　先实现一个64位整数的平方根，根据之前的手算平方根，程序也不是那么难写了。

#include <stdint.h>

uint64_t _sqrt_u64(uint64_t a)

{

        int i;

        uint64_t res;

        uint64_t remain;

        //0的平方根是0,特殊处理一下

        if(a == 0ull)

                return 0ull;

        //找到最高位的1，并且产生平方根结果最高位的1

        for(i=62;;i-=2)

                if(a&(3ull<<i)) {

                        res = 1ull;

                        remain = ((a&(3ull<<i))>>i) - 1ull;

                        i -= 2;

                        break;

                }

        //根据手算平方根的原理，依次产生各位结果

        for(;i>=0;i-=2) {

                //右移动两位，并把a接着的两位并入remain

                remain = (remain<<2)|((a&(3ull<<i))>>i);

                if(((res<<2)|1ull) <= remain) {

                        //产生新一位的1

                        remain = remain - ((res<<2)|1ull);

                        res = (res<<1)|1ull;

                } else {

                        //产生新一位的0

                        res <<= 1;

                }

        }

        return res;

}

　　其实，可以合在一起写，代码会短一些，但效率会低那么一点点，而且编译器应该不太容易优化。

#include <stdint.h>

uint64_t _sqrt_u64(uint64_t a)

{

        int i;

        uint64_t res;

        uint64_t remain;

        res = remain = 0ull;

        for(i=62;i>=0;i-=2) {

                remain = (remain<<2)|((a&(3ull<<i))>>i);

                if(((res<<2)|1ull) <= remain) {

                        remain = remain - ((res<<2)|1ull);

                        res = (res<<1)|1ull;

                } else {

                        res <<= 1;

                }

        }

        return res;

}

　　不过，我们不需要这个结果。

　　为了验证其正确性，我们来写个C语言的main

#include <stdio.h>

#include <stdint.h>

#include <inttypes.h>

uint64_t _sqrt_u64(uint64_t a);

int main()

{

        uint64_t a, b;

        scanf("%" PRIu64, &a);

        b = _sqrt_u64(a);

        printf("%" PRIu64 "\n",b);

        return 0;

}

　　我们shell程序测试一下，我们当然不可能测试过每一个64bits的数，这个运算量太大，不现实。我们可以用随机取一部分来测试。

#!/bin/bash

#编译

gcc -O2 -s sqrt_u64.c main_sqrt_u64.c -o a.out

#随机测试10000个数

for((i=;i<;i++));do

        #随机产生bits ~，如果是0，代表测试的数就是0

        #如果不是0，则代表要产生的数二进制可以有多少位

        let bits=RANDOM%

        if [ $bits -eq  ]; then

                x=

                y=

        else

                #产生一个bits位的二进制数x

                x=$({

                        #最高位1

                        echo -n

                        #之后每位随机产生

                        for((j=;j<bits;j++));do

                                let x=RANDOM%

                                echo -n $x

                        done

                })

                #用bc将x转换成十进制

                x=$(echo 'obase=10;ibase=2;'"$x" | bc)

               #用bc计算x的平方根取整，理论上和我们的C语言计算一致

               y=$(echo 'sqrt('"$x"')' | bc)

        fi

        #z是我们的C语言计算结果

        z=$(echo $x | ./a.out)

        #比较，如果不一致，就报错

        if [ $y -ne $z ];then

                echo $x $y $z error

                exit

        fi

done

echo OK

　　测试结果表明，我们的C语言还是可以得到正确的结果的。

　　再来回忆下第一节里讲过的浮点数结构，

　　S(1bits) | N(8bits) | A(23bits)

　对于浮点数a*2ⁿ,

1<=a<2，n为整数，

　　如果n是偶数，

　　那么a*2ⁿ的平方根是sqrt(a)*2^n/2，也满足1<=sqrt(a)<2，n/2是整数；

　　如果n为奇数，

　　那么a*2ⁿ的平方根是sqrt(2*a)*2^(n-1)/2，也满足1<=sqrt(2*a)<2，(n-1)/2是整数。

　　所以此处要用a或者2*a来开平方根，

　　回忆一下浮点数的结构，单精度浮点数的精度是23位。

　　表示的是科学计数法a*2ⁿ的a减去1的部分，那么加上整数1可以用二进制24位表示。

　　于是，我们就想，一个二进制48位或47位长的数，平方根是二进制24位。那么，我们就可以用一个48位或47位的二进制整数的平方根计算结果的小数部分。

　　nan/inf/-inf以及负数的平方根都是nan，

　　0.0的平方根是0.0,

　　-0.0的平方根是-0.0（可能只是某些库里是这样的），

　　以上都可以在计算的时候特殊化一下。

　　规格数（就是用科学计数法表示的浮点数）的平方根也是规格数，

　　S=0，N=0，A>0代表的是A*2^-149，也就是(A*2)*2^-150，

　　我们稍微计算一下，可以明白，所有的此类数的平方根都在规格数表示的范围内。

　　于是，有了以下的代码。

#include <stdint.h>

static uint32_t _sqrt_(uint64_t a)

{

        int i;

        uint64_t res;

        uint64_t remain;

        res = remain = 0ull;

        //之前整数平方根被直接优化，我们只需要求47位或者48位整数的平方根

        for(i=46;i>=0;i-=2) {

                remain = (remain<<2)|((a&(3ull<<i))>>i);

                if(((res<<2)|1ull) <= remain) {

                        remain = remain - ((res<<2)|1ull);

                        res = (res<<1)|1ull;

                } else {

                        res <<= 1;

                }

        }

        return (uint32_t)res;

}

float mysqrtf(float f)

{

        union {

                float f;

                uint32_t u;

        } n;

        uint32_t N,A;

        int _N, i;

        uint64_t _A;

        n.f = f;

        if(n.u == 0x80000000 || n.u == 0x00000000) /* 0.0/-0.0 */

                return n.f;

        N = (n.u&(0xff<<23))>>23;

        if(N==0xff||(n.u&0x80000000)) { /* inf/-inf/nan/  f < 0.0*/

                n.u = 0x7fc00000; /* nan */

                return n.f;

        }

        if(N!=0x0) { /* 用科学计数法表示的规格数 */

                A = (n.u&0x7fffff)|0x800000;

                _N = (int)N - 127;

                if(N&0x1) {

                        _A = (uint64_t)A<<23;

                } else {

                        _A = (uint64_t)A<<24;

                        _N--;

                }

        } else { //A*2^(-149)这种表示方式的浮点数

                //还是需要找最高位

                for(i=22;;i--)

                        if(n.u&((0x1)<<i))

                                break;

                //然后需要移位，要区分奇数和偶数

                if(i&0x1) {

                        _N = i-149;

                        _A = (uint64_t)n.u << (46-i);

                } else {

                        _N = i-150;

                        _A = (uint64_t)n.u << (47-i);

                }

        }

        //小数部分

        A = _sqrt_(_A);

        //指数部分

        N = (uint32_t)(_N/2+127);

        //得到结果

        n.u = (A&0x7fffff)|(N<<23);

        return n.f;

}

　　同样，也写个测试用的程序，对inf/-inf/nan/0.0/-0.0以及负数不测了，这些很简单。

#include <stdio.h>

#include <stdint.h>

#include <math.h>

#include <time.h>

#include <stdlib.h>

#include <inttypes.h>

int main(int argc, char **argv)

{

        union {

                float f;

                uint32_t u;

        } n;

        uint32_t A,N;

        float f,f2;

        int i;

        srand((unsigned)time(NULL));

        //随机10000个数据

        for(i=0;i<10000;i++) {

                N = rand()%256;

                if(N==255)

                        N=254;

                A = 0x0;

                A |= rand()%256;

                A |= (rand()%256)>>8;

                A |= (rand()%256)>>16;

                n.u = (A&0x7fffff)|(N<<23);

                f = sqrtf(n.f);

                f2 = mysqrtf(n.f);

                printf("%.60f %.60f\n",f,f2);

        }

        return 0;

}

　　结果发现，我们的程序和数学库里的sqrtf结果有细微差别。

　　于是，我们决定再加个小东西，就是四舍五入。之前我们用的是47位或者48位数开平方，为了四舍五入，我们需要多一位，于是就用49位或者50位数开平方。

　　修改一下mysqrtf，增加两位拿去开平方，_sqrt_也动一下。

#include <stdint.h>

static uint32_t _sqrt_(uint64_t a)

{

        int i;

        uint64_t res;

        uint64_t remain;

        res = remain = 0ull;

        //之前整数平方根被直接优化，我们只需要求49位或者50位整数的平方根

        for(i=48;i>=0;i-=2) {//这里之前是46,改成48

                remain = (remain<<2)|((a&(3ull<<i))>>i);

                if(((res<<2)|1ull) <= remain) {

                        remain = remain - ((res<<2)|1ull);

                        res = (res<<1)|1ull;

                } else {

                        res <<= 1;

                }

        }

        return (uint32_t)res;

}

float mysqrtf(float f)

{

        union {

                float f;

                uint32_t u;

        } n;

        uint32_t N,A;

        int _N, i;

        uint64_t _A;

        n.f = f;

        if(n.u == 0x80000000 || n.u == 0x00000000) /* 0.0/-0.0 */

                return n.f;

        N = (n.u&(0xff<<23))>>23;

        if(N==0xff||(n.u&0x80000000)) { /* inf/-inf/nan/  f < 0.0*/

                n.u = 0x7fc00000; /* nan */

                return n.f;

        }

        if(N!=0x0) { /* 用科学计数法表示的规格数 */

                A = (n.u&0x7fffff)|0x800000;

                _N = (int)N - 127;

                if(N&0x1) {

                        _A = (uint64_t)A<<25;

                } else {

                        _A = (uint64_t)A<<26;

                        _N--;

                }

        } else { //A*2^(-149)这种表示方式的浮点数

                //还是需要找最高位

                for(i=22;;i--)

                        if(n.u&((0x1)<<i))

                                break;

                //然后需要移位，要区分奇数和偶数

                if(i&0x1) {

                        _N = i-149;

                        _A = (uint64_t)n.u << (48-i);

                } else {

                        _N = i-150;

                        _A = (uint64_t)n.u << (49-i);

                }

        }

        //小数部分

        A = _sqrt_(_A);

        //四舍五入

        A = (A+(A&0x1))>>1;

        //指数部分

        N = (uint32_t)(_N/2+127);

        //得到结果

        n.u = (A&0x7fffff)|(N<<23);

        return n.f;

}

　　然后再测，准确无误。于是我们可以完工了。

平方根的C语言实现(三) ——最终程序实现的更多相关文章

深入研究C语言第三篇
本篇研究TC2.0下其他几个工具.同时看看TC由源代码到exe程序的过程. 1. 用TCC将下面的程序编为.obj文件我们知道,TCC在默认的编译连接一个C语言的源程序a.c的时候分为以下两步: ( ...
利用Scala语言开发Spark应用程序
Spark内核是由Scala语言开发的,因此使用Scala语言开发Spark应用程序是自然而然的事情.如果你对Scala语言还不太熟悉,可以阅读网络教程A Scala Tutorial for Ja ...
.NET DLL 保护措施详解(三)最终效果
针对.NET DLL 保护措施详解所述思路完成最终的实现,以下为程序包下载地址下载注意: 运行环境为.net4.0,需要安装VS2015 C++可发行组件包vc_redist.x86.exe.然后 ...
ASP.NET MVC：多语言的三种技术处理策略
ASP.NET MVC:多语言的三种技术处理策略背景本文介绍了多语言的三种技术处理策略,每种策略对应一种场景,这三种场景是: 多语言资源信息只被.NET使用. 多语言资源信息只被Javascrip ...
Swift5 语言指南(三) 快速之旅
传统表明,新语言中的第一个程序应在屏幕上打印“Hello,world!”字样.在Swift中,这可以在一行中完成: print("Hello, world!") // Prints ...
UWP 多语言的三个概念
首先了解一下 RFC4646 和 BCP-47 是什么东西: RFC4646 The name is a combination of an ISO 639 two-letter lowercase ...
SAS进阶《深入解析SAS》之开发多语言支持的SAS程序
SAS进阶<深入解析SAS>之开发多语言支持的SAS程序 1. 多语言支持的应用程序是指该程序在世界给第使用时,其能够处理的数据,以及处理数据的方式.信息展现的方式都符合当地的语言.文化习 ...
[转载] 使用C/C++语言编写基于DSP程序的注意事项
原文地址:『转』使用C/C++语言编写基于DSP程序的注意事项作者:skysmile 1.不影响执行速度的情况下,可以使用c或c/c++语言提供的函数库,也可以自己设计函数,这样更易于使用“裁缝师 ...
C语言之简易了解程序环境
C语言之简易了解程序环境大纲: 程序的翻译环境预编译编译汇编链接程序的运行环境在ANSI C的任何一种实现中,存在两个不同的环境. 第1种是翻译环境,在这个环境中源代码被转换为可执行的机 ...

随机推荐

kafka原理和实践（一）原理：10分钟入门
系列目录 kafka原理和实践(一)原理:10分钟入门 kafka原理和实践(二)spring-kafka简单实践 kafka原理和实践(三)spring-kafka生产者源码 kafka原理和实践( ...
Ali OSS 服务端签名并设置回调，客户端上传文件
一.最近做阿里云oss文件上传开发,一点收获分享给大家,帮助大家绕过一些坑.关于阿里云oss服务的介绍,我这里不做赘述了,可以查看阿里云OSS开发api文档. 在这里我主要介绍下,文件上传流程比较复杂 ...
Tarjan算法：求解图的割点与桥（割边）
简介: 割边和割点的定义仅限于无向图中.我们可以通过定义以蛮力方式求解出无向图的所有割点和割边,但这样的求解方式效率低.Tarjan提出了一种快速求解的方式,通过一次DFS就求解出图中所有的割点和割边 ...
numpy中关于*和dot的区别
1.numpy乘法运算中"*"是数组元素逐个计算 >>> import numpy as np >>> a = np.array([[2,3], ...
Java基础(二)-static关键字分析
static关键字是我们在编程中经常会使用到的,但有些可能只知其然而不知其所以然.下面介绍static关键字的作用再通过例子结合说明. static关键字共有五种作用(先说明static所修饰的不会改 ...
P1040 加分二叉树
转自:(http://www.cnblogs.com/geek-007/p/7197439.html) 经典例题:加分二叉树(Luogu 1040) 设一个 n 个节点的二叉树 tree 的中序遍历为 ...
VMware中克隆虚拟机出现eth0改变为eth1情况
解决如下: 查看复制虚拟机网卡信息如下: root@jcfx-2 ~]# ifconfig eth1 Link encap:Ethernet HWaddr 00:0C:29:CC:32:63 inet ...
【luogu P1471】方差
https://www.luogu.org/problem/show?pid=1471 一眼就能看出是线段树/树状数组题目了. 求平均不用说,线段树/树状数组维护区间和即可. 方差怎么求?先变换下方差 ...
Redis在Linux安装详细步骤
一.准备环境: 1.VMware 2.CentOS 3.redis-3.0.4.tar.gz 4.下载地址 Http://redis.io/ 英文版 Http://www.redis.cn/ 中 ...
C++ queue deque
queue queue 队,一种先进先出的数据结构,c++ stl里也叫容器适配器,它是以deque 或list为基础的一种数据结构 queue的相关操作 queue<int deque< ...

平方根的C语言实现(三) ——最终程序实现

平方根的C语言实现(三) ——最终程序实现的更多相关文章

随机推荐

热门专题