【转】Duff's Device

在看strcpy、memcpy等的实现发现用了内存对齐，每一个word拷贝一次的办法大大提高了实现效率，参加该blog（http://totoxian.iteye.com/blog/1220273）。

duff's device也是利用了类似的原理减少比较的次数来提高了效率。

前几天在网上看见了一段代码，叫做“Duff's Device”，后经验证它曾出现在Bjarne的TC++PL里面：

void send( int * to, int * from, int count)
         //    Duff设施，有帮助的注释被有意删去了
{
         int n = (count + 7 ) / 8 ;
         switch (count % 8 ) {
         case 0 :    do { * to ++ = * from ++ ;
         case 7 :          * to ++ = * from ++ ;
         case 6 :          * to ++ = * from ++ ;
         case 5 :          * to ++ = * from ++ ;
         case 4 :          * to ++ = * from ++ ;
         case 3 :          * to ++ = * from ++ ;
         case 2 :          * to ++ = * from ++ ;
         case 1 :          * to ++ = * from ++ ;
                } while ( -- n >    0 );
        }
}

代码的结构显得非常巧妙，把一个switch语句和一个do-while语句糅合在了一起。而在我看过的所有关于C和C++的书中，这样的代码都是毫无道理的。然而，无论是在VS2005还是在GCC4.1.2下，这段代码都能正确地通过编译。加上适当的main函数，它都可以正常运行。我百思不得其解。上网去查，也没查到好答案。

怎么办？先看看它的汇编代码吧，也许可以通过它的汇编代码看出它的意思。

gcc -S send.cpp

粗略地一看，汇编代码都已经上百行了，而且里面还有一个跳转表，十几个标号。一般情况下，几十行的汇编代码都已经不太好看懂了，要把这几百行汇编完全看懂，估计需要花很多时间。

既然直接来太麻烦，那就用简便一点的方法吧：
#include < iostream >
using namespace std;

int main()
{
     int n = 0 ;
     switch (n) {
     case   0 : do   {cout <<   " 0 "   << endl;
     case 1 :         cout <<   " 1 "   << endl;
     case 2 :         cout <<   " 2 "   << endl;
     case   3 :         cout <<   " 3 "   << endl;
            }   while ( -- n > 0 );
    }
}

实验结果 n的值程序输出
0 0
1
2
3
1 1
2
3
2 2
3
0
1
2
3
3 3
0
1
2
3
0
1
2
3
其他 (无输出)

这下终于弄清楚了。原来，那段代码的主体还是do-while循环，但这个循环的入口点并不一定是在do那里，而是由这个switch语句根据n，把循环的入口定在了几个case标号那里。也就是说，程序的执行流程是：程序一开始顺序执行，当它执行到了switch的时候，就会根据n的值，直接跳转到 case n那里（从此，这个swicth语句就再也没有用了）。程序继续顺序执行，再当它执行到while那里时，就会判断循环条件。若为真，则while循环开始，程序跳转到do那里开始执行循环（这时候由于已经没有了switch，所以后面的标号就变成普通标号了，即在没有goto语句的情况下就可以忽略掉这些标号了）；为假，则退出循环，即程序中止。

忙活了几个小时，终于明白这段代码是怎么回事了。回想一下，自己以前也曾写过类似C的语法但比C语法简单很多的解释器，用的是递归子程序法。而如果用递归下降法来分析这段代码，是肯定会有问题的。

至于它是怎么正确编译并运行的，这需要去研究一下C编译器，这个以后再说。现在，还是再来看看达夫设备吧。其实，这个send函数的签名就已经很具有提示性了：把from数组中的元素拷贝count个到to里面去。于是有人会说，这个工作简单，不就这样吗：
void my_send( int   * to, int   * from, int count)
{
     for ( int i =   0 ; i != count; ++ i) {
         * to ++   =   * from ++ ;
    }
}

这段代码的确很简洁，也是正确的，而且生成的机器码也比send函数短很多。但是却忽略了一个因素：执行效率。计算一下就可以知道，my_send函数里面的循环条件，即i和count的比较运算的次数，是达夫设备的8倍！在做整数赋值这种耗时很少的工作时，这种耗时相对较高的比较工作是会大大地影响函数整体的效率的。达夫设备则是一种非常巧妙的解决办法（当然，它利用到了编译器的一些实现上的工作），而且如果把8换成更大的数的话，效率就还可以提高！

它的思路是这样的：把原数组以8个int为单位分成若干个小组，复制的时候以小组为单位复制，即一次复制8个 int。也就是说，在my_send函数中以一次比较运算的代价换来1个int的复制，而在达夫设备中，却能以一次比较运算的代价换来8个int的复制。而switch语句则是用来处理分组时剩下的不到8个的int（这些剩余的不是数组最后的，而是数组最开始的），很巧妙。

总结：像达夫设备这样的代码，从语言的角度来看，我个人觉得不值得我们借鉴。因为这毕竟不是“正常”的代码，至少C/C++标准不会保证这样的代码一定不会出错。另外，这种代码估计有很多人根本都没见过，如果自己写的代码别人看不懂，这也会是一件很让人头疼的事。然而，从算法的角度来看，我觉得达夫设备是个很高效、很值得我们去学习的东西。把一次消耗相对比较高的操作“分摊“到了多次消耗相对比较低的操作上面，就像vector<T>中实现可变长度的数组的思想那样，节省了大量的机器资源，也大大提高了程序的效率。这是值得我们学习的。

【转】Duff's Device的更多相关文章

达夫设备/达夫算法（Duff's Device）
主要是下面的代码: register n = (count + 7) / 8; /\* count > 0 assumed \*/ switch (count % 8) { case 0: ...
读高性能JavaScript编程第四章 Duff's Device
又要开始罗里吧嗦的第四章 Summary 了. 这一次我尽量精简语言. 如果你认为重复调用一个方法数次有点辣眼睛的话比如: function test(i){ process(i++); pr ...
冷知识：达夫设备(Duff's Device)效率真的很高吗?
ID:技术让梦想更伟大作者:李肖遥 wechat链接:https://mp.weixin.qq.com/s/b1jQDH22hk9lhdC9nDqI6w 相信大家写业务逻辑的时候,都是面向if.el ...
达夫设备（Duff's Device）
达夫设备设备是一段非常巧妙,看起来非常诡异的c代码,它可以很大的提高程序执行的效率(本文将试验),达夫设备的来源我就不说了,我们来分析一下. 达夫设备是考虑到我们一般用for或者while循环的时候, ...
duff's device
const duffDevice = (items, process) => { let iterations = Math.floor(items.length / 8); let start ...
Javascript Duff装置循环展开(Javascript Loop unrolling Duff device)
Javascript 中会用到for 循环,当要循环的数据记录很多的时候,可能会对性能产生很大影响.这时我们可以考虑展开for循环,这时就要用到Duff装置(Duff Device). 先来看一个小例 ...
The Coroutine
关于Coroutine 说到coroutine就不的不说subroutine,也就是我们常用到的一般函数.调用一个函数开始执行,然后函数执行完成后就退出,再次调用的时候,再从头开始,调用之间是没有保存 ...
高性能JavaScript 达夫设备
前言在<高性能JavaScript>一书的第四章算法和流程控制中,提到了减少迭代次数加速程序的策略—达夫设备(Duff's device).达夫设备本身很好理解,但是其效果是否真的像书中 ...
JS学习笔记12_优化
一.可维护性优化 1.添加注释注释能够增强代码的可读性以及可维护性,当然,理想情况是满满的注释,但这不太现实.所以我们只需要在一些关键的地方添上注释: 函数和方法:尤其是返回值,因为直接看不出来大 ...

随机推荐

Python’s SQLAlchemy vs Other ORMs[转发 7] 比较结论
Comparison Between Python ORMs For each Python ORM presented in this article, we are going to list t ...
教你9个提升 Wordpress 网站安全性的方法
大约一个月前,这个部落格被黑客入侵(编按:Amit Agarwal 的网站).而其他托管于相同主机商的网站像是 ctrlq.org 和2hundredzeros.com 也深受其害,黑客成功从网路上拿 ...
WinForm 菜单和工具栏
菜单和工具栏: 1.MenuStrip:顶部菜单优先级最高,默认在最顶部 (1)分割线:a.打一个减号 “-” b.右键插入Separator (2)点击事件:每 ...
繁星——jquery的data()方法
今天在看JQuery文档的时候偶然看到了data()方法,觉得挺好用的,这里做个记录. 这个方法用于在元素上存放数据,返回jQuery对象.在文档中提到V1.4.3 新增用法NEW data(obj) ...
ionic 集锦
一.隐藏返回按钮场景:登录.注册成功后,阻止返回 //方法一 $ionicHistory.currentView($ionicHistory.backView()); $state.go('home ...
获取当前时间UTC时间的下一个15分钟时间点
ZonedDateTime zdt = ZonedDateTime.now(ZoneOffset.UTC); int now15Minute = zdt.getMinute() / P15MINUTE ...
【mysql】语句优化
论坛上看到有个类似的分割查看查询结果的梗一时手痒就出手治一治比如有 A B 表A 表ID,NAME1,A2,B3,C B 表FK_ID,TYPE,VALUE1,socer,1001,socker ...
Python Day02
Python 代码执行流程: 编译 --> 执行源代码 --> 字节码 --> 机器码 --> CPU执行 python 先将自己的源代码,编译成Python 字节 ...
android studio 换护眼的颜色步骤
设置--->Editor-->General-->Default Text-->Background护眼色是#D2E3C7
memset函数详解
语言中memset函数详解(2011-11-16 21:11:02)转载▼标签: 杂谈分类: 工具相关功能: 将s所指向的某一块内存中的每个字节的内容全部设置为ch指定的ASCII值, 块的大 ...

【转】Duff's Device

在看strcpy、memcpy等的实现发现用了内存对齐，每一个word拷贝一次的办法大大提高了实现效率，参加该blog（http://totoxian.iteye.com/blog/1220273）。

前几天在网上看见了一段代码，叫做“Duff's Device”，后经验证它曾出现在Bjarne的TC++PL里面：

【转】Duff's Device的更多相关文章

随机推荐

热门专题