在项目中看到了likely、unlikely宏的使用, 一直不是非常清楚它们的作用,所以就深究下。

likely表示被測试的表达式大多数情况下为true, unlikely则表示相反。

两个宏定义:

#define likely(x) __builtin_expect(!!(x), 1)
#define unlikely(x) __builtin_expect(!!(x), 0)

这两个宏常常在条件转移的语句中使用,如if, else if等,这些语句生成的汇编代码都带有jmp指令.

CPU流水线的一些基本知识.
CPU流水线设计将一条指令的运行分成了好几个阶段,每一个阶段都是独立的逻辑电路。并且每一个阶段都有自己的阶段寄存器,所以各个阶段就能够实现真正的并行运行。

这里借用下CSAPP上的插图:



这里每条指令被分成了3个阶段, 指令I1的A阶段运行完成后。指令I2进入了A阶段运行,而指令I1则进入B阶段运行。I1的B阶段和I2的A阶段是并行运行的。
jmp指令对流水线带来的影响
由于jmp指令的运行会导致CPU跳转到还有一个内存地址,运行全新的指令,导致流水线里面的指令失效。所以CPU须要flush掉流水线上的寄存器。这样的操作须要几个cycle来恢复流水线的运行. 这样的影响被称之为hazard, 详细能够參考hazard Wiki
likely,unlikely带来的优化

依据gcc手冊, 所以这两个宏是用来告诉编译器分支的可能走向,从而帮助CPU进行分支预測来增强CPU流水线性能的.

看下以下的代码


int main (char *argv[], int argc) {
int v; v = atoi(argv[1]); if (likely(a == 5))
a++;
else
a--; printf("%d\n", a); return 0;
}

编译。带上-O2选项,得到的汇编代码:


0000000000400510 <main>:
400510: 48 83 ec 08 sub $0x8,%rsp
400514: 48 8b 7f 08 mov 0x8(%rdi),%rdi
400518: 31 c0 xor %eax,%eax
40051a: e8 f1 fe ff ff callq 400410 <atoi@plt>
40051f: 83 f8 02 cmp $0x2,%eax
400522: 75 18 jne 40053c <main+0x2c> /* likely在这里表示a非常有可能是2, 所以将运行a++和printf调用放在一起, 免去了jmp带来的影响 */
400524: be 03 00 00 00 mov $0x3,%esi
400529: bf 48 06 40 00 mov $0x400648,%edi
40052e: 31 c0 xor %eax,%eax
400530: e8 bb fe ff ff callq 4003f0 <printf@plt>
400535: 31 c0 xor %eax,%eax
400537: 48 83 c4 08 add $0x8,%rsp
40053b: c3 retq
40053c: 8d 70 ff lea -0x1(%rax),%esi
40053f: eb e8 jmp 400529 <main+0x19> /* jump到调用printf代码处, 导致cpu flush掉流水线上的内容. */
400541: 90 nop
适用场景
gcc手冊表示这两条指令应该在程序猿对分支走向相当确定的情况下使用。只是大多数程序猿还是会预測失败,所以建议经过大量profiling来确定可能性。

在linux内核代码中likely和unlikely常常被用在错误代码处理的情况, 由于发生错误的情况往往是少数的。

likely, unlikely的作用的更多相关文章

  1. if __name__== "__main__" 的意思(作用)python代码复用

    if __name__== "__main__" 的意思(作用)python代码复用 转自:大步's Blog  http://www.dabu.info/if-__-name__ ...

  2. (转载)linux下各个文件夹的作用

    linux下的文件结构,看看每个文件夹都是干吗用的/bin 二进制可执行命令 /dev 设备特殊文件 /etc 系统管理和配置文件 /etc/rc.d 启动的配置文件和脚本 /home 用户主目录的基 ...

  3. github中的watch、star、fork的作用

    [转自:http://www.jianshu.com/p/6c366b53ea41] 在每个 github 项目的右上角,都有三个按钮,分别是 watch.star.fork,但是有些刚开始使用 gi ...

  4. web.xml中welcome-file-list的作用

    今天尝试使用struts2+ urlrewrite+sitemesh部署项目,结果发现welcome-file-list中定义的欢迎页不起作用: <welcome-file-list> & ...

  5. web.xml中load-on-startup的作用

    如下一段配置,熟悉DWR的再熟悉不过了:<servlet>   <servlet-name>dwr-invoker</servlet-name>   <ser ...

  6. SQLSERVER中NULL位图的作用

    SQLSERVER中NULL位图的作用 首先感谢宋沄剑提供的文章和sqlskill网站:www.sqlskills.com,看下面文章之前请先看一下下面两篇文章 SQL Server误区30日谈-Da ...

  7. 电容与EMC-电容不同功能时对整板EMC的作用

    一般我们的pcb板的器件有很多种类,但是值得特别关注的,很多人都会说是BGA.接口.IC.晶振之类,因为这些都是layout功能模块以及设计难点.然而数量上占绝对优势的器件却是阻容器件,之前围殴阻抗时 ...

  8. FTP的搭建与虚拟目录作用<之简单讲解>

    操作系统:win7 VS2010编写WebService与在IIS的发布<之简单讲解>中我已经说了IIS安装与使用,不明白的可以跳过去看. 1.添加FTP站点 2. 3. 4. 5. zq ...

  9. 火狐浏览器中event不起作用解决办法--记录(一)

    今天遇到了这个问题.IE,谷歌下都没问题,但在FF下却不起作用,很郁闷查了半天,看别人博文写了老长,结果试了要么起作用,但太麻烦,要么不起作用,说了那么多跟没说一样. 其实只要这一句代码就行:e=ar ...

  10. scheduleInRunLoop作用

    例子一: - (void)setUpStreamForFile:(NSString *)path { // iStream is NSInputStream instance variable iSt ...

随机推荐

  1. C/C++中输入多组数据方法

    --------开始-------- 对于刚开始学编程的人来说每次基本上就是一次数据输入,多次的话基本也是会给定一个数组的大小,但随着做刷算法题开始,题目有的会不直接告诉输入几组数据,基本输入都是多组 ...

  2. netty百万连接跟踪记录

    0. 启动客户端和服务端 # 测试环境: centos7 jdk8 2核16G# 服务端启动nohup java -Xmx8192m -Xms4096m -XX:+UseG1GC -XX:Parall ...

  3. Cracking the Coding Interview 10.7

    Design an algorithm to find the kth number such that the only prime factors are 3,5 and 7 方法一: a[i]= ...

  4. HTML学习笔记——DOCTYPE和DTD,标准模式和兼容模式

    主要涉及知识点: HTML与XHTML HTML与XHTML的区别 DOCTYPE与DTD的概念 DTD的分类以及DOCTYPE的声明方式 标准模式(Standard Mode)和兼容模式(Quirc ...

  5. 易企CMS模板调用标签列表

    格式化URL formaturl 参数:type (生成URL类型) 可选值:article,product,category,catalog,comment参数:siteurl (生成URL网站地址 ...

  6. SqlServer 导出指定表数据 生成Insert脚本

    版权声明:本文为博主原创文章,未经博主允许不得转载.

  7. dubbo之多版本

    当一个接口实现,出现不兼容升级时,可以用版本号过渡,版本号不同的服务相互间不引用. 可以按照以下的步骤进行版本迁移: 在低压力时间段,先升级一半提供者为新版本 再将所有消费者升级为新版本 然后将剩下的 ...

  8. AI:恐怖谷理论的陷阱

    科学人的小品:恐怖谷:娃娃为什么很可怕? 一.恐怖的来源 恐怖的来源:美学概念.思想对安全的认识,映射到美学领域,转化为美和丑.恐怖,是一种精心掩饰的丑陋. 二.桑尼与C3PO 桑尼更接近于人,为什么 ...

  9. HDU_1711_初识KMP算法

    Number Sequence Time Limit: 10000/5000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) ...

  10. iframe的2个问题

    1.iframe里的视频无全屏按钮<iframe src="" allowfullscreen></iframe>allowfullscreen有个浏览器前 ...