性能量化之cpu

系统现在很慢”似乎是对系统的性能最常用的抱怨了，但究竟慢到什么程度，如何来界定慢，可能需要对性能进行量化，对于OS来说，大致主要分为cpu，内存，磁盘，网络等组件，对这些维度的性能量化，不但可以更准确的定位到系统的瓶颈，更是做容量评估的基础。下面先看看cpu。

Cpu的性能主要跟缓存，主频，指令集，工艺，流水线等相关因素有关。

当前微处理器的设计上主要分为精简指令集（RISC），复杂指令集（CISC），所以对于不同的cpu来说，如果使用的指令集不同，单纯的从时钟频率来判断频率高的就相应的性能就高，通常并不准确。

Cpu的性能上每18个月就会增长一倍，而内存的速度在七年里才增长一倍，鉴于速度上的不匹配，而产生的L1，L2 cache。下表是不同的存储访问的延时。

Cache location and type    Access time (in ns)    Size    "Good" hit rate

L1 on-chip    　　　　　　　　　　　　　　　　　1-3    8-64 KB    >90%

L2 on-chip    　　　　　　　　　　　　　　　　 6-18    1-8 MB    >50%

L3 off-chip    　　　　　　　　　　　　　　  30-40    8-32 MB    >30%

Main memory    　　　　　　　　　　　　　　　　220    Very large    -

对于开发或者运维人员来说，无法离开业务或者系统的负载来谈cpu的量化，拿着指令集来进行性能调优或者容量规划似乎是make no sense。所以对当前cpu的负载能力，这里从三个方面来量化：cpu数量，cpu利用率，load。

1， cpu数量

这里是在测试机上，linux操作系统查看当前cpu的个数：

    物理cpu个数：

[root@xpchild ~]# cat /proc/cpuinfo | grep "physical id" | sort | uniq | wc -l

2

cpu core的个数：

[root@xpchild ~]# cat /proc/cpuinfo | grep "cpu cores" | uniq -c

16 cpu cores       : 4

逻辑cpu的个数：

[root@xpchild ~]#  cat /proc/cpuinfo | grep "siblings" | uniq

siblings        : 8

即这台机器：两颗物理cpu，每颗物理cpu有4个cores。而每颗物理cpu又有8个逻辑cpu，即开启了超线程，每个core 又enable了超线程，所以会看到有16个processor。

2， load

其实load的指标反映的是进程的排队情况，也就是当cpu的处理能力不足的时候，进程会在运行的队列里进行排队，等待cpu时间，当系统的任务过多，cpu处理能力不足的时候，load就会显著的升高。

先了解下进程的状态，如下图：

从使用系统调用fork()创建一个进程到进程从进程表中删除，进程会经历多种的状态，在上图显示了六种状态，分表是：

executing in user mode
executing in kernel mode
ready to run
sleeping
newly created, not ready to run, and not sleeping
issued exit system call (zombie)

一个进程的生命周期可以描述为：

首先会调用fork()来创建一个进程，然后当exec()的时候，并不是就分配了cpu，因为cpu的分配有多种方式，比如抢占式，时间片轮询等，所以这时进程会进入准备队列，即就绪状态，随时都可以执行。

当进程获得cpu时间的时候，进程会进入状态1(running in user mode)，这时也会因为system clock的原因而重新又进入准备队列中。

比如进程要读取操作系统文件的内容，那么将发起一个系统调用read()，进程进入状态2(running in kernel mode)，然后cpu将执行os的服务程序，这里执行的其实就是硬盘控制器的驱动程序，执行完成后，进程进入状态4(sleeping)。

驱动程序其实是发送的硬盘控制器的指令，硬盘控制器接受到指令后，开始从硬盘上读取数据，这时进程一直处在sleeping的状态，等数据准备完成之后，硬盘控制器将发送一个中断指令，cpu接受到中断后，进入中断服务处理程序，拷贝数据到内存中，然后进程被唤醒，从新进入就绪状态。

当进程显示的调用exit()时，系统调用将释放进程使用的数据结构，但进程表中的slot还保留着，因为这块区域是exit的代码区域，父进程需要根据它来判断是否正常exit，这时进程进入状态6(zombie)，这时进程除了process table里的一些内容外，没有了其它任何东西，所以也没有办法kill这个进程，这个时候只能等待系统来清理。

查看当前系统的load：

[oracle@xpchild /home/oracle]

$ cat /proc/loadavg

1.73 2.10 1.96 3/2569 866

参数的解释是：

avg_1 (1.73) 1-分钟平均负载

lavg_5 (2.10) 5-分钟平均负载

lavg_15(1.96) 15-分钟平均负载

nr_running (3) 在采样时刻，运行队列的任务的数目

nr_threads (2569) 在采样时刻，系统中活跃的任务的个数（不包括运行已经结束的任务）

last_pid(866) 最大的pid值，包括轻量级进程，即线程

如果当前系统有两个cpu，那么每颗cpu的的运行队列长度就是1.73/2=0.86。

对于load的值，如果恰好等于系统的cpu的个数，说明没有排队的现象，cpu的处理能力刚好能够处理当前的任务，如果load除以cpu的个数大于5的话，就说明排队的现象比较严重，cpu就开始成为系统的瓶颈了。

3， cpu利用率的计算

[oracle@xpchild /home/oracle]

$ cat /proc/stat

cpu  1328826685 9908 956723151 37475308887 385172562 1674680 40475782

cpu0 410951159 118 270447961 1807752465 3995607 1256760 17354845

cpu1 87245025 2055 64833801 2348250538 9854553 51903 1531320

cpu2 72781822 257 61529788 2352243761 22342448 9670 2855194

cpu3 46745786 1206 44133270 2248648260 170037161 69330 2128288

cpu4 123440853 1554 31290213 2341183797 13100817 84271 2656769

cpu5 36306470 620 11485132 2460075134 3238150 39536 624727

cpu6 56711524 8 60381304 2390770657 2721730 1 1174918

cpu7 35676024 46 84850159 2356783851 33411961 0 1038483

cpu8 99217709 166 22269812 2386700351 2648336 46 921814

cpu9 35316582 71 9077959 2465760121 1396419 0 218414

cpu10 55429624 5 58736923 2393997677 2403804 0 1190020

cpu11 36376053 127 91350249 2353554118 29403857 2 1075565

cpu12 94113797 2498 20676353 2381646886 13099910 86996 2131685

cpu13 35960873 644 11974688 2451183596 11241526 31587 1376153

cpu14 64988644 65 47646699 2371237606 24944343 15514 2924129

cpu15 37564733 461 66038834 2365520062 41331934 29056 1273450

intr 32192598678 3652207391 10 0 6 6 0 0 0 0 150 0 0 65 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 41 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1169002395 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 961594445 0 0 0 0 0 0 0 3774974 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3762233747 0 0 0 0 0 0 0 1168948909 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 60 0 0 0 0 0

ctxt 74186330107

btime 1286108830

processes 76903816

procs_running 4

procs_blocked 0

user (1328826685) 从系统启动开始累计到当前时刻，用户态的CPU时间（单位：jiffies），不包含 nice值为负进程。1jiffies=0.01秒
nice (9908) 从系统启动开始累计到当前时刻，nice值为负的进程所占用的CPU时间（单位：jiffies）
system (956723151) 从系统启动开始累计到当前时刻，核心时间（单位：jiffies）
idle (37475308887) 从系统启动开始累计到当前时刻，除硬盘IO等待时间以外其它等待时间（单位：jiffies）
iowait (385172562) 从系统启动开始累计到当前时刻，硬盘IO等待时间（单位：jiffies），
irq (1674680) 从系统启动开始累计到当前时刻，硬中断时间（单位：jiffies）
softirq (40475782) 从系统启动开始累计到当前时刻，软中断时间（单位：jiffies）
CPU时间=user+system+nice+idle+iowait+irq+softirq

“intr”这行给出中断的信息，第一个为自系统启动以来，发生的所有的中断的次数；然后每个数对应一个特定的中断自系统启动以来所发生的次数。
“ctxt”给出了自系统启动以来CPU发生的上下文交换的次数。
“btime”给出了从系统启动到现在为止的时间，单位为秒。
“processes (total_forks) 自系统启动以来所创建的任务的个数目。
“procs_running”：当前运行队列的任务的数目。
“procs_blocked”：当前被阻塞的任务的数目。

Cpu利用率的计算方法：

这是一段perl脚本的计算cpu利用率的代码

$cpuline = `cat /proc/stat |grep -w cpu| head -1`;

 chomp($cpuline);

 @cpu_arr = split /\s+/,$cpuline;

 $cpu_total=$cpu_arr[]+$cpu_arr[]+$cpu_arr[]+$cpu_arr[]+$cpu_arr[]+$cpu_arr[]+$cpu_arr[];

 if(! defined $cpu_pre_total){

        $cpu_usr=0;

        $cpu_sys=0;

        $cpu_id=0;

        $cpu_io=0;

 } 

 else{

        $cpu_usr = int(($cpu_arr[]+$cpu_arr[]-$cpu_pre_usr)*100/($cpu_total - $cpu_pre_total));

        $cpu_sys = int(($cpu_arr[]+$cpu_arr[]+$cpu_arr[]-$cpu_pre_sys)*100/($cpu_total - $cpu_pre_total));

        $cpu_io  = int(($cpu_arr[]-$cpu_pre_io)*100/($cpu_total - $cpu_pre_total));

        $cpu_id  = int(($cpu_arr[]-$cpu_pre_id)*100/($cpu_total - $cpu_pre_total));

 }

 $cpu_pre_usr = $cpu_arr[]+$cpu_arr[];

 $cpu_pre_sys = $cpu_arr[]+$cpu_arr[]+$cpu_arr[];

 $cpu_pre_io  = $cpu_arr[];

 $cpu_pre_id  = $cpu_arr[];

 $cpu_pre_total = $cpu_arr[]+$cpu_arr[]+$cpu_arr[]+$cpu_arr[]+$cpu_arr[]+$cpu_arr[]+$cpu_arr[];

User的cpu利用率=(user+nice)/total

System的cpu利用率=（system+irq+ softirq）/total

Idle的cpu利用率=（idle）/total

Io的cpu利用率=（io wait）/total

所以，在对cpu进行性能量化的时候，可以根据这几个方面进行评估，cpu的特性，cpu的数量，当前系统的压力（主要关注load，cpu利用率这两个指标）。

性能量化之cpu的更多相关文章

Linux性能优化实战CPU篇之总结（四）
一.分析CPU瓶颈 1,性能指标 a>CPU使用率 CPU使用率描述了非空闲时间占总CPU时间的百分比,根据CPU上运行任务的不同可以分为:用户CPU.系统CPU.等待I/O CPU.软中断和硬 ...
【好书摘要】性能优化中CPU、内存、磁盘IO、网络性能的依赖
系统优化是一项复杂.繁琐.长期的工作,优化前需要监测.采集.测试.评估,优化后也需要测试.采集.评估.监测,而且是一个长期和持续的过程,不是说现在优化了,测试了,以后就可以一劳永逸了,也不是说书本上 ...
paip.提升性能---mysql 优化cpu多核以及lan性能的关系.
paip.提升性能---mysql 优化cpu多核以及lan性能的关系. 作者Attilax 艾龙, EMAIL:1466519819@qq.com 来源:attilax的专栏地址:http:/ ...
linux性能问题（CPU，内存，磁盘I/O，网络）
一. CPU性能评估 1.vmstat [-V] [-n] [depay [count]] -V : 打印出版本信息,可选参数 -n : 在周期性循环输出时,头部信息仅显示一次 delay : 两次输 ...
数据库性能高校：CPU使用过高(下)
CPU使用率过高的常见原因查询优化器会尽量从CPU,IO和内存资源成本最小的角度,找到最高效的数据访问方式.如果没有正确的索引,或者写的语句本身就会忽略索引, 又或者不准确的统计信息等情况下,查询计 ...
【转】一文掌握 Linux 性能分析之 CPU 篇
[转]一文掌握 Linux 性能分析之 CPU 篇平常工作会涉及到一些 Linux 性能分析的问题,因此决定总结一下常用的一些性能分析手段,仅供参考. 说到性能分析,基本上就是 CPU.内存.磁盘 ...
Db2性能：系统CPU高问题分析的一些思路
Db2性能:系统CPU高问题分析的一些思路 1. 如何判断CPU高? 有很多操作系统的命令可以看出来,比如ps -elf,iostat, vmstat, top/topas, 2. 收集数据 CPU高 ...
KVM总结-KVM性能优化之CPU优化
前言任何平台根据场景的不同,都有相应的优化.不一样的硬件环境.网络环境,同样的一个平台,它跑出的效果也肯定不一样.就好比一辆法拉利,在高速公路里跑跟乡村街道跑,速度和激情肯定不同… 所以,我们做运维 ...
Linux系统和性能监控之CPU篇
Linux系统和性能监控之CPU篇性能优化就是找到系统处理中的瓶颈以及去除这些的过程.本文由sanotes.net站长tonnyom在2009年8月翻译自Linux System and Perfo ...

随机推荐

C#常用正则验证
#region Protected Property protected Regex rLetters { get { return new Regex("[a-zA-Z]{1,}" ...
SEVERE: Class [ com/mysema/query/dml/DeleteClause ] not found
SEVERE: Class [ com/mysema/query/dml/DeleteClause ] not found. Error while loading [ class org.spr ...
学习笔记_Java_day13_JSTL标签库（1、2、3、4、5、6、7、8）
1.一种标签语言 day13 l JSTL标签库(重点) l 自定义标签(理解) l MVC设计模式(重点中的重点) l Java三层框架(重点中的重点) JSTL标签库 1 什么是JSTL ...
iOS开发——免证书调试（Xcode7，iOS9）
(资料已做好,待整理成文章……)
javascript 基础3第13节
<html> <head> <title>javascript基础</title> </head> <body> 1.流程控制 ...
12_注解04_注解实现Action调用Service，Service调用Dao的过程
[工程截图] [PersonDao.java] package com.HigginCui.annotation; public interface PersonDao { public void s ...
bzoj1260[CQOI2007]涂色paint
思路:区间dp,用f[i][j]表示区间[i,j]的答案,然后转移即可. #include<iostream> #include<cstdio> #include<cst ...
cmake,gtest单元测试程序
参考:http://blog.csdn.net/stdcoutzyx/article/details/8284183 PROJECT (HELLO) SET(SRC_LIST main.c) MESS ...
leetcode problem 10 Regular Expression Matching(动态规划)
Implement regular expression matching with support for '.' and '*'. '.' Matches any single character ...
CentOS使用ufw的方法
ufwはファイアウォールの管理ツールで.Ubuntuで標準的に使われています.ufw allow 80/tcp のような簡単なコマンドでポートを開け閉めできます. CentOS用のパッケージは用意され ...

性能量化之cpu

性能量化之cpu的更多相关文章

随机推荐

热门专题