关于MemoryBarrier

备注：OSG OpenThread::Atomic.cpp中MemoryBarrier();

Atomic::operator unsigned() const

{

#if defined(_OPENTHREADS_ATOMIC_USE_GCC_BUILTINS)

    __sync_synchronize();

    return _value;

#elif defined(_OPENTHREADS_ATOMIC_USE_WIN32_INTERLOCKED)

    MemoryBarrier();

    return _value;

#elif defined(_OPENTHREADS_ATOMIC_USE_BSD_ATOMIC)

    OSMemoryBarrier();

    return static_cast<unsigned const volatile>(_value);

#else

# error This implementation should happen inline in the include file

#endif

}

MemoryBarrier();保证函数返回的值，直接从内存中读取，而不是从寄存器中读取；


内核中定义的内存屏障原语有：
#define barrier() __asm__ __volatile__("": : :"memory") #define mb() alternative("lock; addl $0,0(%%esp)", "mfence", X86_FEATURE_XMM2) #define rmb() alternative("lock;

 addl $0,0(%%esp)", "lfence", X86_FEATURE_XMM2) #ifdef CONFIG_SMP #define smp_mb() mb() #define smp_rmb() rmb() #define smp_wmb() wmb() #define smp_read_barrier_depends() read_barrier_depends() #define set_mb(var, value) do { (void) xchg(&var, value); } while

 (0) #else #define smp_mb() barrier() #define smp_rmb() barrier() #define smp_wmb() barrier() #define smp_read_barrier_depends() do { } while(0) #define set_mb(var, value) do { var = value; barrier(); } while (0) #endif 1). smp_xxx()和xxx()的差别 为了给其他CPU也提供相关的barrier宏。

 比如x86的rmb()是用了lfence指令，但其他CPU不能用这个指令。 2). 关于barrier()宏，jkl大师是这么说的： CPU越过内存屏障后，将刷新自己对存储器的缓冲状态。这条语句实际上不生成不论什么代码，但可使gcc在 barrier()之后刷新寄存器对变量的分配。 也就是说，barrier()宏仅仅约束gcc编译器，不约束执行时的CPU行为。 举例： 1 int a = 5, b = 6; 2 barrier(); 3 a = b; 在line 3，GCC不会用存放b的寄存器给a赋值，而是invalidate

 b的Cache line，又一次读内存中的b值，赋值给a。 3). mb() vs. rmb() vs. wmb() rmb()不同意读操作穿过内存屏障；wmb()不同意写操作穿过屏障；而mb()二者都不同意。 看IA32上wmb()的定义： #ifdef CONFIG_X86_OOSTORE #define wmb() alternative("lock;addl $0,0(%%esp)", "sfence", X86_FEATURE_XMM); #else #define wmb() __asm__ __volatile__

 ("": : :"memory"); #endif Intel和AMD都没有在IA32 CPU中实现乱序写(Out-Of-Order Store)，所以wmb()定义为空操作，不约束CPU行为；但 有些IA32 CPU厂商实现了OOO Store，所以就有了使用sfence的那个wmb()实现。 
总线加锁的功能是保证程序运行的顺序不乱掉， 

一旦加LOCK指令了，CPU会将此指令前的读写操作都串行完毕，这最基本的作用是使CPU的预取等无效了。 

在这个串行操作中，MESI协议会起作用。 

但保证全部CPU的Cache一致性的是MESI协议，这是硬件上保证的。 

barrier是对GCC编译器做约束，是软件层次上的。 

“因此barrier就能保证全部CPU的Cache一致性”这样的说法是不正确的。 

lock指令保证程序运行的顺序不乱掉，没有将“本CPU的Cache写入了内存”的功能。 

总线监视功能是由各个CPU的CACHE完毕的， 

这个功能能够算是MESI协议的实现。MESI保证了SMP下的CACHE一致性。 

MESI协议 





包含IA32的很多体系结构的CPU，为了保证缓存一致性，实现了MESI协议。 





M: Modified，已改动 


E: Exclusive，排他 


S: Shared，共享 


I: Invalid，无效 





IA32 的CPU实现了MESI协议来保证Cache coherence。 CPU的总线监測单元，始终监视着总线上全部的内存写操作， 


以便随时调整自己的Cache状态。 





-> Modified。 本CPU写，则直接写到Cache，不产生总线事物；其他CPU写，则不涉及本CPU的Cache，其他CPU 


读，则本CPU须要把Cache line中的数据提供给它，而不是让它去读内存。 





-> Exclusive。仅仅有本CPU有该内存的Cache，并且和内存一致。 本CPU的写操作会导致转到Modified状态。 





-> Shared。 多个CPU都对该内存有Cache，并且内容一致。不论什么一个CPU写自己的这个Cache都必须通知其他 


的CPU。 





-> Invalid。 一旦Cache line进入这个状态，CPU读数据就必须发出总线事物，从内存读。 








5) 考虑到DMA 





5.1). Wirte through策略。 这样的情形比較简单。 





-> 本CPU写内存，是write through的，因此不管什么时候DMA读内存，读到的都是正确数据。 


-> DMA写内存，假设DMA要写的内存被本CPU缓存了，那么必须Invalidate这个Cache line。下次CPU读它，就 


直接从内存读。 





5.2). Write back策略。 这样的情形相当复杂。 





-> DMA读内存。被本CPU总线监视单元发现，并且本地Cache中有Modified数据，本CPU就截获DMA的内存读操作， 


把自己Cache Line中的数据返回给它。 





-> DMA写内存。并且所写的位置在本CPU的Cache中，这又分两种情况： 


a@ Cache Line状态未被CPU改动过(即cache和内存一致)，那么invalidate该cache line。 


b@ Cache Line状态已经被改动过，又分2种情况： 





<1> DMA写操作会替换CPU Cache line所相应的整行内存数据，那么DMA写，CPU则invalidate 


自己的Cache Line。 


<2> DMA写操作仅仅替换Cache Line相应的内存数据的一部分，那么CPU必须捕获DMA写操作的新 


数据(即DMA想把它写入内存的)，用来更新Cache Line的相关部分。

关于MemoryBarrier的更多相关文章

Lock,LockFree,MemoryBarrier,ConcurrentCollection
最近看并行编程书本的一些心得,简单记录下多线程和并行编程必知必会的几个概念,再次加深自己的理解. .NET Framework4提供了一个新的命名空间System.Collections.Concur ...
细说.NET中的多线程 (六使用MemoryBarrier，Volatile进行同步)
上一节介绍了使用信号量进行同步,本节主要介绍一些非阻塞同步的方法.本节主要介绍MemoryBarrier,volatile,Interlocked. MemoryBarriers 本文简单的介绍一下这 ...
MemoryBarrier，Volatile
使用MemoryBarrier,Volatile进行同步上一节介绍了使用信号量进行同步,本节主要介绍一些非阻塞同步的方法.本节主要介绍MemoryBarrier,volatile,Interlock ...
【C# 线程】内存屏障 MemoryBarrier
背景同步基元分为用户模式和内核模式用户模式:Iterlocked.Exchange(互锁).SpinLocked(自旋锁).易变构造(volatile关键字.volatile类.Thread.Vo ...
[百度空间] [转]内存屏障 - MemoryBarrier
处理器的乱序和并发执行目前的高级处理器,为了提高内部逻辑元件的利用率以提高运行速度,通常会采用多指令发射.乱序执行等各种措施.现在普遍使用的一些超标量处理器通常能够在一个指令周期内并发执行多条指令. ...
C#与C++的发展历程第三 - C#5.0异步编程巅峰
系列文章目录 1. C#与C++的发展历程第一 - 由C#3.0起 2. C#与C++的发展历程第二 - C#4.0再接再厉 3. C#与C++的发展历程第三 - C#5.0异步编程的巅峰 C#5.0 ...
《Note --- Unreal --- MemPro （CONTINUE... ...）》
Mem pro 是一个主要集成内存泄露检测的工具,其具有自身的源码和GUI,在GUI中利用"Launch" button进行加载自己待检测的application,目前支持的平台为 ...
AliSQL的编译使用
1.下载源码 git clone https://github.com/alibaba/AliSQL.git Linux下编译 2.编译编译前需要安装好gcc cmake bison等.(如果缺少其 ...
Disruptor-NET和内存栅栏
Disruptor-NET算法(是一种无锁算法)需要我们自己实现某一种特定的内存操作的语义以保证算法的正确性.这时我们就需要显式的使用一些指令来控制内存操作指令的顺序以及其可见性定义.这种指令称为内存 ...

随机推荐

log4net使用具体解释
说明:本程序演示怎样利用log4net记录程序日志信息.log4net是一个功能著名的开源日志记录组件.利用log4net能够方便地将日志信息记录到文件.控制台.Windows事件日志和数据库(包含M ...
Ado.net对象
Connection对象主要提供与数据库的连接功能 Command 对象用于返回数据,修改数据,运行存储过程以及发送或检索参数信息的数据库命令. DataReader对象通过Command对象提供从数 ...
《第一行代码》学习笔记3－活动Activity（1）
1.活动-一种可以包含用户界面的组件,用于和用户进行交互. <Button android:id="@+id/button_1" android:layout_width=& ...
gitolite随记
1.git clone源码 git clone git://github.com/sitaramc/gitolite 2.安装 gitolite/install -ln 3.建立git仓库 gitol ...
OpenGL ES 2.0 限定符
限定符说明作用 attribute 一般用于各个顶点各不相同的量,如顶点位置.颜色等属性限定符,修饰的变量用来接收渲染管线传递进顶点着色器的当前顶点的各种属性值. 只能用来修饰符点数标量,浮点数 ...
HDU 5904 - LCIS (BestCoder Round #87)
HDU 5904 - LCIS [ DP ] BestCoder Round #87 题意: 给定两个序列,求它们的最长公共递增子序列的长度, 并且这个子序列的值是连续的分析: 状态转移方程式 ...
IntelliJ IDEA启动web项目时突然变慢的原因
在使用IntelliJ IDEA开发web项目过程中,有两次项目启动非常慢,大约要200s的时间: 第一次忘记是怎么解决的,第二次出现后,我就直接重新下载了代码,然后部署,启动,时间有恢复正常,只用了 ...
php中的MVC模式运用
[size=5][color=Red]php中的MVC模式运用[/color][/size] 首先我来举个例子: 一个简单的文章显示系统简单期间,我们假定这个文章系统是只读的,也就是说这个例子将不涉 ...
windows下使用php重命名目录下的文件
rename函数一直报错,最后发现是windows下文件名的编码问题,如果项目文件是utf-8的话,一定要经过一步转码 $dir = $path . '/../resource/logo'; $han ...
Python操作 Memcache、Redis、RabbitMQ、SQLAlchemy
Memcached Memcached 是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载.它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高动态.数据库驱动网站的速度 ...

关于MemoryBarrier

关于MemoryBarrier的更多相关文章

随机推荐

热门专题