百篇博客系列篇.本篇为:

本篇说清楚原子操作

读本篇之前建议先读鸿蒙内核源码分析(总目录)系列篇.

基本概念

在支持多任务的操作系统中,修改一块内存区域的数据需要“读取-修改-写入”三个步骤。然而同一内存区域的数据可能同时被多个任务访问,如果在修改数据的过程中被其他任务打断,就会造成该操作的执行结果无法预知。

使用开关中断的方法固然可以保证多任务执行结果符合预期,但这种方法显然会影响系统性能。

ARMv6架构引入了LDREXSTREX指令,以支持对共享存储器更缜密的非阻塞同步。由此实现的原子操作能确保对同一数据的“读取-修改-写入”操作在它的执行期间不会被打断,即操作的原子性。

有多个任务对同一个内存数据进行加减或交换操作时,使用原子操作保证结果的可预知性。

看过鸿蒙内核源码分析(总目录)自旋锁篇的应该对LDREX和STREX指令不陌生的,自旋锁的本质就是对某个变量的原子操作,而且一定要通过汇编代码实现,也就是说LDREXSTREX指令保证了原子操作的底层实现.

回顾下自旋锁申请和释放锁的汇编代码.

ArchSpinLock 申请锁代码

  1. FUNCTION(ArchSpinLock) @死守,非要拿到锁
  2. mov r1 #1 @r1=1
  3. 1: @循环的作用,因SEV是广播事件.不一定lock->rawLock的值已经改变了
  4. ldrex r2 [r0] @r0 = &lock->rawLock r2 = lock->rawLock
  5. cmp r2 #0 @r2和0比较
  6. wfene @不相等时,说明资源被占用,CPU核进入睡眠状态
  7. strexeq r2 r1 [r0]@此时CPU被重新唤醒,尝试令lock->rawLock=1,成功写入则r2=0
  8. cmpeq r2 #0 @再来比较r2是否等于0,如果相等则获取到了锁
  9. bne 1b @如果不相等,继续进入循环
  10. dmb @用DMB指令来隔离,以保证缓冲中的数据已经落实到RAM
  11. bx lr @此时是一定拿到锁了,跳回调用ArchSpinLock函数

ArchSpinUnlock 释放锁代码

  1. FUNCTION(ArchSpinUnlock) @释放锁
  2. mov r1 #0 @r1=0
  3. dmb @数据存储隔离,以保证缓冲中的数据已经落实到RAM
  4. str r1 [r0] @令lock->rawLock = 0
  5. dsb @数据同步隔离
  6. sev @给各CPU广播事件,唤醒沉睡的CPU
  7. bx lr @跳回调用ArchSpinLock函数

运作机制

鸿蒙通过对ARMv6架构中的LDREXSTREX进行封装,向用户提供了一套原子操作接口。

  • LDREX Rx, [Ry]

    读取内存中的值,并标记对该段内存为独占访问:

    • 读取寄存器Ry指向的4字节内存数据,保存到Rx寄存器中。
    • 对Ry指向的内存区域添加独占访问标记。
  • STREX Rf, Rx, [Ry]

    检查内存是否有独占访问标记,如果有则更新内存值并清空标记,否则不更新内存:

    • 有独占访问标记

      • 将寄存器Rx中的值更新到寄存器Ry指向的内存。
      • 标志寄存器Rf置为0。
    • 没有独占访问标记
      • 不更新内存。
      • 标志寄存器Rf置为1。
  • 判断标志寄存器

    标志寄存器为0时,退出循环,原子操作结束。

    标志寄存器为1时,继续循环,重新进行原子操作。

功能列表

原子数据包含两种类型Atomic(有符号32位数)与 Atomic64(有符号64位数)。原子操作模块为用户提供下面几种功能,接口详细信息可以查看源码。

此处讲述 LOS_AtomicAddLOS_AtomicSubLOS_AtomicReadLOS_AtomicSet

理解了函数的汇编代码是理解的原子操作的关键.

LOS_AtomicAdd

  1. //对内存数据做加法
  2. STATIC INLINE INT32 LOS_AtomicAdd(Atomic *v INT32 addVal)
  3. {
  4. INT32 val;
  5. UINT32 status;
  6. do {
  7. __asm__ __volatile__("ldrex %1, [%2]\n"
  8. "add %1, %1, %3\n"
  9. "strex %0, %1, [%2]"
  10. : "=&r"(status), "=&r"(val)
  11. : "r"(v), "r"(addVal)
  12. : "cc");
  13. } while (__builtin_expect(status != 0 0));
  14. return val;
  15. }

这是一段C语言内嵌汇编,逐一解读

    1. 先将 status val v addVal的值交由通用寄存器(R0~R3)接管.
    1. %2代表了入参v,[%2]代表的是参数v指向地址的值,也就是 *v ,函数要独占的就是它
    1. %0 ~ %3 对应 status val v addVal
    1. ldrex %1, [%2] 表示 val = *v ;
    1. add %1, %1, %3 表示 val = val + addVal;
    1. strex %0, %1, [%2] 表示 *v = val;
    1. status 表示是否更新成功,成功了置0,不成功则为 1
    1. __builtin_expect是结束循环的判断语句,将最有可能执行的分支告诉编译器。

      这个指令的写法为:__builtin_expect(EXP, N)。

      意思是:EXP==N 的概率很大。

      综合理解__builtin_expect(status != 0, 0)

      说的是status = 0 的可能性很大,不成功就会重新来一遍,直到strex更新成(status == 0)为止.

    1. "=&r"(val) 被修饰的操作符作为输出,即将寄存器的值回给val,val为函数的返回值
    1. "cc"向编译器声明以上信息.

LOS_AtomicSub

  1. //对内存数据做减法
  2. STATIC INLINE INT32 LOS_AtomicSub(Atomic *v INT32 subVal)
  3. {
  4. INT32 val;
  5. UINT32 status;
  6. do {
  7. __asm__ __volatile__("ldrex %1, [%2]\n"
  8. "sub %1, %1, %3\n"
  9. "strex %0, %1, [%2]"
  10. : "=&r"(status), "=&r"(val)
  11. : "r"(v), "r"(subVal)
  12. : "cc");
  13. } while (__builtin_expect(status != 0 0));
  14. return val;
  15. }

解读

  • LOS_AtomicAdd解读

volatile

这里要重点说下volatilevolatile 提醒编译器它后面所定义的变量随时都有可能改变,因此编译后的程序每次需要存储或读取这个变量的时候,都要直接从变量地址中读取数据。如果没有volatile关键字,则编译器可能优化读取和存储,可能暂时使用寄存器中的值,如果这个变量由别的程序更新了的话,将出现不一致的现象。

  1. //读取内存数据
  2. STATIC INLINE INT32 LOS_AtomicRead(const Atomic *v)
  3. {
  4. return *(volatile INT32 *)v;
  5. }
  6. //写入内存数据
  7. STATIC INLINE VOID LOS_AtomicSet(Atomic *v INT32 setVal)
  8. {
  9. *(volatile INT32 *)v = setVal;
  10. }

编程实例

调用原子操作相关接口,观察结果:

1.创建两个任务

  • 任务一用LOS_AtomicAdd对全局变量加100次。
  • 任务二用LOS_AtomicSub对全局变量减100次。

2.子任务结束后在主任务中打印全局变量的值。

  1. #include "los_hwi.h"
  2. #include "los_atomic.h"
  3. #include "los_task.h"
  4. UINT32 g_testTaskId01;
  5. UINT32 g_testTaskId02;
  6. Atomic g_sum;
  7. Atomic g_count;
  8. UINT32 Example_Atomic01(VOID)
  9. {
  10. int i = 0;
  11. for(i = 0; i < 100; ++i) {
  12. LOS_AtomicAdd(&g_sum1);
  13. }
  14. LOS_AtomicAdd(&g_count1);
  15. return LOS_OK;
  16. }
  17. UINT32 Example_Atomic02(VOID)
  18. {
  19. int i = 0;
  20. for(i = 0; i < 100; ++i) {
  21. LOS_AtomicSub(&g_sum1);
  22. }
  23. LOS_AtomicAdd(&g_count1);
  24. return LOS_OK;
  25. }
  26. UINT32 Example_TaskEntry(VOID)
  27. {
  28. TSK_INIT_PARAM_S stTask1={0};
  29. stTask1.pfnTaskEntry = (TSK_ENTRY_FUNC)Example_Atomic01;
  30. stTask1.pcName = "TestAtomicTsk1";
  31. stTask1.uwStackSize = LOSCFG_BASE_CORE_TSK_DEFAULT_STACK_SIZE;
  32. stTask1.usTaskPrio = 4;
  33. stTask1.uwResved = LOS_TASK_STATUS_DETACHED;
  34. TSK_INIT_PARAM_S stTask2={0};
  35. stTask2.pfnTaskEntry = (TSK_ENTRY_FUNC)Example_Atomic02;
  36. stTask2.pcName = "TestAtomicTsk2";
  37. stTask2.uwStackSize = LOSCFG_BASE_CORE_TSK_DEFAULT_STACK_SIZE;
  38. stTask2.usTaskPrio = 4;
  39. stTask2.uwResved = LOS_TASK_STATUS_DETACHED;
  40. LOS_TaskLock();
  41. LOS_TaskCreate(&g_testTaskId01 &stTask1);
  42. LOS_TaskCreate(&g_testTaskId02 &stTask2);
  43. LOS_TaskUnlock();
  44. while(LOS_AtomicRead(&g_count) != 2);
  45. dprintf("g_sum = %d\n" g_sum);
  46. return LOS_OK;
  47. }

结果验证

  1. g_sum = 0

鸿蒙内核源码分析.总目录

v08.xx 鸿蒙内核源码分析(总目录) | 百万汉字注解 百篇博客分析 | 51.c.h .o

百万汉字注解.百篇博客分析

百万汉字注解 >> 精读鸿蒙源码,中文注解分析, 深挖地基工程,大脑永久记忆,四大码仓每日同步更新< gitee| github| csdn| coding >

百篇博客分析 >> 故事说内核,问答式导读,生活式比喻,表格化说明,图形化展示,主流站点定期更新中< 51cto| csdn| harmony| osc >

关注不迷路.代码即人生

QQ群:790015635 | 入群密码: 666

原创不易,欢迎转载,但请注明出处.

鸿蒙内核源码分析(原子操作篇) | 是谁在为原子操作保驾护航 | 百篇博客分析OpenHarmony源码 | v34.02的更多相关文章

  1. v72.01 鸿蒙内核源码分析(Shell解析) | 应用窥伺内核的窗口 | 百篇博客分析OpenHarmony源码

    子曰:"苟正其身矣,于从政乎何有?不能正其身,如正人何?" <论语>:子路篇 百篇博客系列篇.本篇为: v72.xx 鸿蒙内核源码分析(Shell解析篇) | 应用窥视 ...

  2. v75.01 鸿蒙内核源码分析(远程登录篇) | 内核如何接待远方的客人 | 百篇博客分析OpenHarmony源码

    子曰:"不学礼,无以立 ; 不学诗,无以言 " <论语>:季氏篇 百篇博客分析.本篇为: (远程登录篇) | 内核如何接待远方的客人 设备驱动相关篇为: v67.03 ...

  3. v76.01 鸿蒙内核源码分析(共享内存) | 进程间最快通讯方式 | 百篇博客分析OpenHarmony源码

    百篇博客分析|本篇为:(共享内存篇) | 进程间最快通讯方式 进程通讯相关篇为: v26.08 鸿蒙内核源码分析(自旋锁) | 当立贞节牌坊的好同志 v27.05 鸿蒙内核源码分析(互斥锁) | 同样 ...

  4. v79.01 鸿蒙内核源码分析(用户态锁篇) | 如何使用快锁Futex(上) | 百篇博客分析OpenHarmony源码

    百篇博客分析|本篇为:(用户态锁篇) | 如何使用快锁Futex(上) 进程通讯相关篇为: v26.08 鸿蒙内核源码分析(自旋锁) | 当立贞节牌坊的好同志 v27.05 鸿蒙内核源码分析(互斥锁) ...

  5. v78.01 鸿蒙内核源码分析(消息映射篇) | 剖析LiteIpc(下)进程通讯机制 | 百篇博客分析OpenHarmony源码

    百篇博客分析|本篇为:(消息映射篇) | 剖析LiteIpc(下)进程通讯机制 进程通讯相关篇为: v26.08 鸿蒙内核源码分析(自旋锁) | 当立贞节牌坊的好同志 v27.05 鸿蒙内核源码分析( ...

  6. v80.01 鸿蒙内核源码分析(内核态锁篇) | 如何实现快锁Futex(下) | 百篇博客分析OpenHarmony源码

    百篇博客分析|本篇为:(内核态锁篇) | 如何实现快锁Futex(下) 进程通讯相关篇为: v26.08 鸿蒙内核源码分析(自旋锁) | 当立贞节牌坊的好同志 v27.05 鸿蒙内核源码分析(互斥锁) ...

  7. 鸿蒙内核源码分析(Shell编辑篇) | 两个任务,三个阶段 | 百篇博客分析OpenHarmony源码 | v71.01

    子曰:"我非生而知之者,好古,敏以求之者也." <论语>:述而篇 百篇博客系列篇.本篇为: v71.xx 鸿蒙内核源码分析(Shell编辑篇) | 两个任务,三个阶段 ...

  8. 鸿蒙内核源码分析(管道文件篇) | 如何降低数据流动成本 | 百篇博客分析OpenHarmony源码 | v70.01

    百篇博客系列篇.本篇为: v70.xx 鸿蒙内核源码分析(管道文件篇) | 如何降低数据流动成本 | 51.c.h.o 文件系统相关篇为: v62.xx 鸿蒙内核源码分析(文件概念篇) | 为什么说一 ...

  9. 鸿蒙内核源码分析(文件句柄篇) | 深挖应用操作文件的细节 | 百篇博客分析OpenHarmony源码 | v69.01

    百篇博客系列篇.本篇为: v69.xx 鸿蒙内核源码分析(文件句柄篇) | 深挖应用操作文件的细节 | 51.c.h.o 文件系统相关篇为: v62.xx 鸿蒙内核源码分析(文件概念篇) | 为什么说 ...

随机推荐

  1. css生成彩色阴影

    通常用css生成单色或者同色系的的阴影(box-shadow),其实可以通过巧妙的利用 filter: blur 模糊滤镜,可以生成渐变色或者说是颜色丰富的阴影效果,如图: 原理: 利用伪元素,生成一 ...

  2. CPU 进程 线程 关系与区别

  3. Vue.JS快速上手(Vue-router 实现SPA 开发)

    一.什么是路由 URL -> 映射 -> 组件 Hash+onhashchange History.pushstate+replaceState+onpopstate 二.准备工作 组件 ...

  4. 地图控件:overview、scale、toolbar

    地图常用控件: 1.AMap.MapType:地图类型切换插件,用来切换固定的几个常用图层 2.AMap.OverView:地图鹰眼插件,默认在地图右下角显示缩略图 3.AMap.Scale:地图比例 ...

  5. LeetCode入门指南 之 回溯思想

    模板 result = {} void backtrack(选择列表, 路径) { if (满足结束条件) { result.add(路径) return } for 选择 in 选择列表 { 做选择 ...

  6. 用C++实现的Eratosthenes筛法程序

    运行示例 只输出素数总数的运行示例 PS H:\Read\num\x64\Release> .\esieve.exe Eratosthenes sieve: a method to find o ...

  7. vue-父子组件之传值和单项数据流问题

    前言 我们知道 vue 中父子组件的核心概念是单项数据流问题,props 是单项传递的.那究竟什么是单项数据流问题,这篇文章来总结一下关于这个知识点的学习笔记. 正文 1.父组件传值给子组件 < ...

  8. Qt5完美解决 界面显示中文乱码

    最近在学习Qt,可是一直头疼于中文乱码问题,上网搜了一下,很多都是Qt4中使用如下方法: QTextCodec *codec = QTextCodec::codecForName("gbk& ...

  9. Servlet监听器详解及举例

    监听器就是一个实现特定接口的普通java程序,这个程序专门用于监听另一个java对象的方法调用或属性改变,当被监听对象发生上述事件后,监听器某个方法将立即被执行. 监听器原理 监听原理 1.存在事件源 ...

  10. 关于Quartus构建nios软核以及eclipse建立c语言工程以及成功下载到FPGA芯片过程遇到的各种问题以及解决方法详解

    这不是一篇构建nios的教程,而是遇到的各种问题以及解决方法.至于构建教程,网上一大把,我推荐正点原子的FPGA教程,比较新,比较详细,通俗易懂!!! 这里以一个点亮LED灯的Nios软核为例,很明显 ...