1. NUMA的几个概念(Node,socket,core,thread)

对于socket,core和thread会有不少文章介绍,这里简单说一下,具体参见下图:

一句话总结:socket就是主板上的CPU插槽; Core就是socket里独立的一组程序执行的硬件单元,比如寄存器,计算单元等; Thread:就是超线程hyperthread的概念,逻辑的执行单元,独立的执行上下文,但是共享core内的寄存器和计算单元。

NUMA体系结构中多了Node的概念,这个概念其实是用来解决core的分组的问题,具体参见下图来理解(图中的OS CPU可以理解thread,那么core就没有在图中画出),从图中可以看出每个Socket里有两个node,共有4个socket,每个 socket 2个node,每个node中有8个thread,总共4(Socket)× 2(Node)× 8 (4core × 2 Thread) = 64个thread。

另外每个node有自己的内部CPU,总线和内存,同时还可以访问其他node内的内存,NUMA的最大的优势就是可以方便的增加CPU的数量,因为 Node内有自己内部总线,所以增加CPU数量可以通过增加Node的数目来实现,如果单纯的增加CPU的数量,会对总线造成很大的压力,所以UMA结构 不可能支持很多的核。

《此图出自:NUMA Best Practices for Dell PowerEdge 12th Generation Servers》

根据上面提到的,由于每个node内部有自己的CPU总线和内存,所以如果一个虚拟机的vCPU跨不同的Node的话,就会导致一个node中的CPU去 访问另外一个node中的内存的情况,这就导致内存访问延迟的增加。在有些特殊场景下,比如NFV环境中,对性能有比较高的要求,就非常需要同一个虚拟机 的vCPU尽量被分配到同一个Node中的pCPU上,所以在OpenStack的Kilo版本中增加了基于NUMA感知的虚拟机调度的特性。

2. 如何查看机器的NUMA拓扑结构

比较常用的命令就是lscpu,具体输出如下:

  1. dylan@hp3000:~$ lscpu
  2. Architecture: x86_64
  3. CPU op-mode(s): 32-bit, 64-bit
  4. Byte Order: Little Endian
  5. CPU(s): 48 //共有48个逻辑CPU(threads)
  6. On-line CPU(s) list: 0-47
  7. Thread(s) per core: 2 //每个core有2个threads
  8. Core(s) per socket: 6 //每个socket有6个cores
  9. Socket(s): 4 //共有4个sockets
  10. NUMA node(s): 4 //共有4个NUMA nodes
  11. Vendor ID: GenuineIntel
  12. CPU family: 6
  13. Model: 45
  14. Stepping: 7
  15. CPU MHz: 1200.000
  16. BogoMIPS: 4790.83
  17. Virtualization: VT-x
  18. L1d cache: 32K //L1 data cache 32k
  19. L1i cache: 32K //L1 instruction cache 32k (牛x机器表现,冯诺依曼+哈弗体系结构)
  20. L2 cache: 256K
  21. L3 cache: 15360K
  22. NUMA node0 CPU(s): 0-5,24-29
  23. NUMA node1 CPU(s): 6-11,30-35
  24. NUMA node2 CPU(s): 12-17,36-41
  25. NUMA node3 CPU(s): 18-23,42-47

从上图输出,可以看出当前机器有4个sockets,每个 sockets包含1个numa node,每个numa node中有6个cores,每个cores包含2个thread,所以总的threads数 量=4(sockets)×1(node)×6(cores)×2(threads)=48.

另外,也可以通过下面的脚本来打印出当前机器的socket,core和thread的数量。

  1. #!/bin/bash
  2. # Simple print cpu topology
  3. # Author: kodango
  4. function get_nr_processor()
  5. {
  6. grep '^processor' /proc/cpuinfo | wc -l
  7. }
  8. function get_nr_socket()
  9. {
  10. grep 'physical id' /proc/cpuinfo | awk -F: '{
  11. print $2 | "sort -un"}' | wc -l
  12. }
  13. function get_nr_siblings()
  14. {
  15. grep 'siblings' /proc/cpuinfo | awk -F: '{
  16. print $2 | "sort -un"}'
  17. }
  18. function get_nr_cores_of_socket()
  19. {
  20. grep 'cpu cores' /proc/cpuinfo | awk -F: '{
  21. print $2 | "sort -un"}'
  22. }
  23. echo '===== CPU Topology Table ====='
  24. echo
  25. echo '+--------------+---------+-----------+'
  26. echo '| Processor ID | Core ID | Socket ID |'
  27. echo '+--------------+---------+-----------+'
  28. while read line; do
  29. if [ -z "$line" ]; then
  30. printf '| %-12s | %-7s | %-9s |\n' $p_id $c_id $s_id
  31. echo '+--------------+---------+-----------+'
  32. continue
  33. fi
  34. if echo "$line" | grep -q "^processor"; then
  35. p_id=`echo "$line" | awk -F: '{print $2}' | tr -d ' '`
  36. fi
  37. if echo "$line" | grep -q "^core id"; then
  38. c_id=`echo "$line" | awk -F: '{print $2}' | tr -d ' '`
  39. fi
  40. if echo "$line" | grep -q "^physical id"; then
  41. s_id=`echo "$line" | awk -F: '{print $2}' | tr -d ' '`
  42. fi
  43. done < /proc/cpuinfo
  44. echo
  45. awk -F: '{
  46. if ($1 ~ /processor/) {
  47. gsub(/ /,"",$2);
  48. p_id=$2;
  49. } else if ($1 ~ /physical id/){
  50. gsub(/ /,"",$2);
  51. s_id=$2;
  52. arr[s_id]=arr[s_id] " " p_id
  53. }
  54. }
  55. END{
  56. for (i in arr)
  57. printf "Socket %s:%s\n", i, arr[i];
  58. }' /proc/cpuinfo
  59. echo
  60. echo '===== CPU Info Summary ====='
  61. echo
  62. nr_processor=`get_nr_processor`
  63. echo "Logical processors: $nr_processor"
  64. nr_socket=`get_nr_socket`
  65. echo "Physical socket: $nr_socket"
  66. nr_siblings=`get_nr_siblings`
  67. echo "Siblings in one socket: $nr_siblings"
  68. nr_cores=`get_nr_cores_of_socket`
  69. echo "Cores in one socket: $nr_cores"
  70. let nr_cores*=nr_socket
  71. echo "Cores in total: $nr_cores"
  72. if [ "$nr_cores" = "$nr_processor" ]; then
  73. echo "Hyper-Threading: off"
  74. else
  75. echo "Hyper-Threading: on"
  76. fi
  77. echo
  78. echo '===== END ====='

————————————————————

NUMA体系结构详解的更多相关文章

  1. Linux内核异常处理体系结构详解(一)【转】

    转自:http://www.techbulo.com/1841.html 2015年11月30日 ⁄ 基础知识 ⁄ 共 6653字 ⁄ 字号 小 中 大 ⁄ Linux内核异常处理体系结构详解(一)已 ...

  2. Oracle体系结构详解

    对于一门技术的学习,尤其是像Oracle database这种知识体系极其庞杂的技术来讲,从宏观上了解其体系结构是至关重要的.同时,个人认为,未必是专业DBA人员才需要了解其体系结构(固然对于数据库专 ...

  3. Android OS体系结构详解

    Google于2007年11月5日宣布的基于Linux平台的开源手机操作系统的名称,该平台由操作系统.中间件.用户界面和应用软件组成,号称是首个为移动终端打造的真正开放和完整的移动软件. 架构详解 下 ...

  4. oracle11g 体系结构详解

    1.oracle内存由SGA+PGA所构成 2.oracle数据库体系结构数据库的体系结构是指数据库的组成.工作过程与原理,以及数据在数据库中的组织与管理机制. oracle工作原理: 1).在数据库 ...

  5. java异常体系结构详解

    前几天在参加网易和360公司的在线考试的时候,都出了一道关于java中异常类的多项选择题.这几天翻看了相关书籍和网上一些资料,结合自己的理解与思考,将自己的一些收获记录如下: 先来看看java中异常的 ...

  6. Spring框架学习——Spring的体系结构详解

    1.Spring简介 Spring是一个轻量级Java开发框架,最早有Rod Johnson创建,目的是为了解决企业级应用开发的业务逻辑层和其他各层的耦合问题.它是一个分层的JavaSE/JavaEE ...

  7. oracle 逻辑体系结构详解

    以前对数据库的了解大多数是集中在mysql,最近工作里面一直使用的是oracle,虽然说在互联网行业mysql大行其道,但是一些传统行业或者是金融领域还是更加倾向于使用oracle,sqlserver ...

  8. JVM体系结构详解

    每个Java开发人员都知道字节码将由JRE (Java运行时环境)执行.但是很多人不知道JRE是Java Virtual Machine(JVM)的实现,它分析字节码.解释代码并执行代码.作为开发者, ...

  9. 吴裕雄--天生自然JAVA SPRING框架开发学习笔记:Spring体系结构详解

    Spring 框架采用分层架构,根据不同的功能被划分成了多个模块,这些模块大体可分为 Data Access/Integration.Web.AOP.Aspects.Messaging.Instrum ...

随机推荐

  1. [NPM] Execute Code from a Remote GitHub Branch with npx

    We will see how you can use npx to pull and execute code from a GitHub repository. If you need even ...

  2. bash參考手冊之六(Bash特性)

    6 Bash 特性 这部分描写叙述Bash独有的特性. *  调用Bash : Bash能够接受的命令行选项. *  Bash启动文件 : Bash何时及怎样运行脚本. *  交互Shell : 什么 ...

  3. iOS中ActionSheet和Alert的区别

    首先,样子长得就不一样 看下图:

  4. NDK 编译armebai-v7a的非4字节对齐crash Fatal signal 7 (SIGSEGV) 错误解决

    一直都是编译armabi的.没有不论什么问题,这个架构是软件模拟浮点运算的. 后来看到NDK文档上说armabi-v7a是针对有硬件处理浮点计算的arm cpu的. 于是就改动配置编译armebai- ...

  5. jquery.datepicker、jquery.validate、jquery.uploadify冲突解决

    Jquery 1.11.2 Jquery.validate 1.13.1 Jquery.Uploadify 3.2(flash版) Jquery.DatePicker 用的是Jquery-ui 1.1 ...

  6. C#.Net中操作XML方法一

    我们知道XML是一种可标记性的语言,用来标记数据.定义数据类型,是一种执行用户对自己的标记语言进行定义的源语言.由于结构好.而且easy理解,就好比一棵树,层次关系分明,因此也经常把一些数据存储到XM ...

  7. filezilla

    中文网站:https://www.filezilla.cn/ 英文网站:https://filezilla-project.org/ FileZilla 客户端是一个快速可靠的.跨平台的FTP,FTP ...

  8. NI License Activator 用法

    双击打开后,看到这种界面,将白色方格通过鼠标右击点绿就能够了. NI <wbr>License <wbr>Activator <wbr>用法 可能会出现这样的情况, ...

  9. hdu5246 超级赛亚ACMer

    Problem Description 百小度是一个ACMer,也是一个超级赛亚人,每一个ACMer都有一个战斗力.包含百小度.
所谓超级赛亚人的定义,是说假设在对抗中刚好接近极限状态,那就会激发斗志 ...

  10. isearch5 index,attribute和summary。

    索引 isearch5 支持的索引分为:index,attribute和summary. Index指的是倒排索引,它存储了存储了从term到DocID的映射关系,形如: term-->(Doc ...