Android绘制优化(一)绘制性能分析
前言
一个优秀的应用不仅仅是要有吸引人的功能和交互,同时在性能上也有很高的要求。运行Android系统的手机,虽然配置在不断的提升,但仍旧无法和PC相比,无法做到PC那样拥有超大的内存以及高性能的CPU,因此在开发Android应用程序时也不可能无限制的使用CPU和内存,如果对CPU和内存使用不当也会造成应用的卡顿和内存溢出等问题。因此,应用的性能优化对于开发人员有着更高的要求。Android性能优化分为很多种,比较常用的有绘制优化、内存优化、耗电优化和稳定性优化等,这个系列我们就来学习性能优化中的绘制优化。
1.绘制原理
Android绘制View有三个主要的步骤,分别是measure、layout和draw。关于它们的原理请查看我的文章Android View体系(七)从源码解析View的measure流程和Android View体系(八)从源码解析View的layout和draw流程,这里就不在赘述。measure、layout和draw方法主要是运行在系统的应用框架层,而真正将数据渲染到屏幕上的则是系统Nativie层的SurfaceFlinger服务来完成的。
绘制过程主要是由CPU 来进行Measure、Layout、Record、Execute的数据计算工作,GPU负责栅格化、渲染。CPU和GPU是通过图形驱动层来进行连接的。图形驱动层维护了一个队列,CPU将display list添加到该队列中,这样GPU就可以从这个队列中取出数据进行绘制。
1.1 渲染时间线
FPS(Frames Per Second)这个名词我想很多同学都知道,它是指画面每秒传输帧数,通俗来讲就是指动画或视频的画面数,最简单的举例就是我们玩游戏时,如果画面在60fps则不会感觉到卡顿,如果低于60fps,比如50fps则会感觉到卡顿,你就可以考虑要换显卡或者采取其他一些措施了。
要想画面保持在60fps,则需要每个绘制时长在16ms以内,如下图所示。
Android系统每隔16ms发出VSYNC信号,触发对UI进行渲染, 如果每次渲染都成功,这样就能够达到流畅的画面所需要的60fps,那什么是VSYNC呢?VSYNC是Vertical Synchronization(垂直同步)的缩写,是一种定时中断,一旦收到VSYNC信号,CPU就开始处理各帧数据。
如果某个操作要花费24ms,这样系统在得到VSYNC信号时无法进行正常的渲染,会发生丢帧。用户会在32ms中看到同一帧的画面,如下图所示。
产生卡顿原因有很多,主要有以下几点:
- 布局Layout过于复杂,无法在16ms内完成渲染。
- 同一时间动画执行的次数过多,导致CPU或GPU负载过重。
- View过度绘制,导致某些像素在同一帧时间内被绘制多次。
- UI线程中做了稍微耗时的操作。
为了解决上述的问题,除了我们要在写代码时要注意外,也可以借助一些工具来分析和解决卡顿问题。
2.Profile GPU Rendering
Profile GPU Rendering是Android 4.1系统提供的开发辅助功能,我们可以在开发者选项中打开这一功能,如下图所示。
打开Profile GPU Rendering_副本_副本.png
我们点击Profile GPU Rendering选项并选择On screen as bars即开启Profile GPU Rendering功能。接着屏幕会显示出彩色的柱状图,如下所示。
上面的彩色的图的横轴代表时间,纵轴表示某一帧的耗时。绿色的横线为警戒线,超过这条线则意味着时长超过了16m,尽量要保证垂直的彩色柱状图保持在绿线下面。这些垂直的彩色柱状图代表着一帧,不同颜色的彩色柱状图代表不同的含义:
- 橙色代表处理的时间,是CPU告诉GPU渲染一帧的地方,这是一个阻塞调用,因为CPU会一直等待GPU发出接到命令的回复,如果橙色柱状图很高,则表明GPU很繁忙。
- 红色代表执行的时间,这部分是Android进行2D渲染 Display List的时间。如果红色柱状图很高,可能是由重新提交了视图而导致的。还有复杂的自定义View也会导致红的柱状图变高。
- 蓝色代表测量绘制的时间,也就是需要多长时间去创建和更新DisplayList。如果蓝色柱状图很高,可能是需要重新绘制,或者View的onDraw方法处理事情太多。
在Android 6.0中,有更多的颜色被加了进来,如下图所示:
下面来分别介绍它们的含义:
- Swap Buffers:表示处理的时间,和上面讲到的橙色一样。
- Command Issue:表示执行的时间,和上面讲到的红色一样。
- Sync & Upload:表示的是准备当前界面上有待绘制的图片所耗费的时间,为了减少该段区域的执行时间,我们可以减少屏幕上的图片数量或者是缩小图片的大小。
- Draw:表示测量和绘制视图列表所需要的时间,和上面讲到的蓝色一样。
- Measure/Layout:表示布局的onMeasure与onLayout所花费的时间,一旦时间过长,就需要仔细检查自己的布局是不是存在严重的性能问题。
- Animation:表示计算执行动画所需要花费的时间,包含的动画有ObjectAnimator,ViewPropertyAnimator,Transition等。一旦这里的执行时间过长,就需要检查是不是使用了非官方的动画工具或者是检查动画执行的过程中是不是触发了读写操作等等。
- Input Handling:表示系统处理输入事件所耗费的时间,粗略等于对事件处理方法所执行的时间。一旦执行时间过长,意味着在处理用户的输入事件的地方执行了复杂的操作。
- Misc Time/Vsync Delay:表示在主线程执行了太多的任务,导致UI渲染跟不上VSYNC的信号而出现掉帧的情况。
Profile GPU Rendering可以找到渲染有问题的界面,但是想要修复的话,只依赖Profile GPU Rendering是不够的,可以用另一个工具Hierarchy Viewer来查看布局层次和每个View所花的时间,这个工具会在下一篇文章进行介绍。
3.Systrace
Systrace是Android4.1中新增的性能数据采样和分析工具。它可帮助开发者收集Android关键子系统(SurfaceFlinger、WindowManagerService等Framework部分关键模块、服务,View体系系统等)的运行信息。Systrace的功能包括跟踪系统的I/O操作、内核工作队列、CPU负载以及Android各个子系统的运行状况等。对于UI显示性能,比如动画播放不流畅、渲染卡顿等问题提供了分析数据。
3.1 使用Systrace
Systrace跟踪的设备要在Android4.1版本以上,对于Android4.3版本之前和4.3版本之后使用上有点区别,现在也很少有人用Android4.3之前的版本,因此这里只讲Android4.3版本的使用方法。Systrace可以在DDMS上使用,可以使用命令行来使用,也可以在代码中进行跟踪。接下来分别来介绍这三种方式。
在DDMS中使用Systrace
1.首先我们要打开Android Studio的Tool中的Android Device Monitor,并连接手机。
2.点击Systrace按钮进入抓取设置界面,如下图所示。
抓取设置界面可以设置跟踪的时间,以及trace文件输出的地址等内容。如下图所示。
QQ截图20170311224620_副本.png
3.设置完成后,我们就来操作的跟踪的过程。跟踪时间结束后,生成trace.html文件。
4.用Chrome打开trace.html文件进行分析。分析的方法,后文会讲到。
用命令行使用Systrace
Android 提供一个python脚本文件 systrace.py,它位于Android SDK 目录 /tools/systrace 中,我们可以执行以下命令来使用Systrace:
$ cd android-sdk/platform-tools/systrace
$ python systrace.py --time=10 -o newtrace.html sched gfx view wm
在代码中使用Systrace
Systrace并不会追踪应用的所有工作,在Android4.3及以上版本的代码中,可以使用Trace类对应用中的具体活动进行追踪。
Android源码中也引用了Trace类,比如RecyclerView:
...
private final Runnable mUpdateChildViewsRunnable = new Runnable() {
public void run() {
if (!mFirstLayoutComplete) {
return;
}
if (mDataSetHasChangedAfterLayout) {
TraceCompat.beginSection(TRACE_ON_DATA_SET_CHANGE_LAYOUT_TAG);
dispatchLayout();
TraceCompat.endSection();
} else if (mAdapterHelper.hasPendingUpdates()) {
TraceCompat.beginSection(TRACE_HANDLE_ADAPTER_UPDATES_TAG);
eatRequestLayout();
mAdapterHelper.preProcess();
if (!mLayoutRequestEaten) {
rebindUpdatedViewHolders();
}
resumeRequestLayout(true);
TraceCompat.endSection();
}
}
};
...
TraceCompat类对Trace类进行了封装,只会在Android4.3及以上版本才会使用Trace类,其中beginSection方法和endSection方法之间的代码会被追踪,endSection方法会只会结束最近的beginSection方法,因此要保证beginSection方法和endSection方法的调用次数要相同。
3.2 用Chrome分析Systrace
通过前面的方法生成的trace.html需要用Chrome打开,打开后效果如下图所示。
我们可以使用W键和S键进行放大和缩小,A键和D键进行左右移动。
Alert区域
首先来看Alert区域,这一区域会标记处性能有问题的点,单击叹号图标就可以查看某一个Alert的问题描述,如下所示。
这个Alert指出了View在Measure/Layout时耗费了大量的时间,导致出现jank(同一帧画了多次)。给出的建议是避免在动画播放期间控制布局。
CPU区域
接下来我们来查看CPU区域,每一行代表一个CPU核心和它执行任务的时间片,放大后会看到每个色块代表一个执行的进程,色块的长度代表其执行时间,如下图所示。
图中CPU 0主要执行adbb线程和InputReader线程,CPU 2主要执行了surfaceflinger线程和ordinatorlayout进程中的RenderThread线程,我们点击RenderThread色块,会给出RenderThread的相关信息,如下图所示。
图中给出了当前色块所运行的线程和进程、开启时间和持续时间等信息。
应用区域
应用区域会显示应用的帧数,如下图所示。
Systrace会给出应用中的Frames分析,每一帧就是一个F圆圈,F圆圈有三种颜色,其中绿色表示Frame渲染流畅,黄色和红色则代表渲染时间超过了16.6ms,其中红的更严重些。我们点击红色F圆圈,会给出该Frame的信息,如下图所示。
从图中可以看出,Frame给出了问题提示:Scheduling delay(调度延迟),当一帧绘制时间超过19ms会触发该提示,更何况这一帧已经有将近40ms了。导致这一问题产生的原因主要是线程在绘制时,在很长一段时间都没有分配到CPU时间片,因此无法继续进行绘制。按m键来高亮该时间段,我们来查看CPU的情况,如下图所示。
可以看出这个时间段中两个CPU都在满负荷运行。至于具体是什么让CPU繁忙,则需要使用Traceview来进行分析。
Alerts总体分析
点开最右边的Alerts按钮会给出Alert的总体分析,如下图所示。
QQ截图20170312150637.png
Alerts会给出Alert类型,以及出现的次数。有了这些总体的分析,方便开发者对该时间段的绘制性能有一个整体的大概了解,便于进行下一步分析。
由于Systrace 是以系统的角度返回一些信息,只能为我们提供一个概览,它的深度是有限的,我们可以用它来进行粗略的检查,以便了解大概的情况,但是如果要分析更详细的,比如要找到是什么让CPU繁忙,某些方法的调用次数等,则还要借助另一个工具:Traceview。
4.Traceview
TraceView是Android SDK中自带的数据采集和分析工具。一般来说,通过TraceView我们可以得到以下两种数据:
- 单次执行耗时的方法。
- 执行次数多的方法。
4.1 使用Traceview
要分析Traceview,则首先要得到一个trace文件,trace文件的获取有两种方式,分别是在DDMS中使用和在代码中加入调试语句,下面分别对这两种方式进行介绍。
DDMS中使用
1.首先我们要打开Android Studio的Tool中的Android Device Monitor,并连接手机。
2.选择相应的进程,并单击Start Method Profiling按钮。
3.对应用中需要监控的点进行操作。
4.单击Stop Method Profiling按钮,会自动跳到TraceView视图。
代码中加入调试语句
如果开发中出现不好复现的问题,则需要在代码中添加TraceView监控语句,代码如下所示。
Debug.startMethodTracing();
...
Debug.stopMethodTracing();
在开始监控的地方调用startMethodTracing方法,在需要结束监控的地方调用stopMethodTracing方法。系统会在SD卡中生成trace文件,将trace文件导出并用SDK中的Traceview打开即可。当然不要忘了在manifest中加入 <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE"/>
权限。
4.2 分析Traceview
为了分析Traceview,我们来举一个简单的例子来生成trace文件,这里采用第二种方式:代码中加入调试语句。代码如下所示。
public class CoordinatorLayoutActivity extends AppCompatActivity {
private ViewPager mViewPager;
private TabLayout mTabLayout;
@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_tab_layout);
Debug.startMethodTracing("test");//
initView();
...
}
private void initView() {
try {
Thread.sleep();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
@Override
protected void onStop() {
super.onStop();
Debug.stopMethodTracing();
}
}
在注释1处调用了startMethodTracing方法开始监控,其中test是生成的trace文件的名称。在initView中我们特意调用sleep方法来做耗时操作。在onStop方法中我们调用了stopMethodTracing方法结束监控。这时会在SD卡根目录生成test.trace文件,我们将该文件导出到桌面,用Traceview来分析test.trace文件,我们在cmd中执行如下语句。
我们进入traceview所在的目录(直接将traceview.bat拖入到cmd中),并执行上图的traceview语句后会弹出Traceview视图,它分为两部分,分别是时间片面板和分析面板,我们先来看时间片面板,如下图所示。
其中x轴代表时间的消耗,单位为ms,y轴代表各个线程。一般会查看色块的长度,明显比较长的方法重点去关注,具体的分析还得看分析面板,如下图所示。
每一列数据的代表的含义如下表所示。
列名 | 含义 |
---|---|
Name | 该线程运行过程中调用的函数名 |
Incl Cpu Time% | 某个方法包括其内部调用的方法所占用CPU时间百分比 |
Excl Cpu Time% | 某个方法不包括其内部调用的方法所占用CPU时间百分比 |
Incl Real Time% | 某个方法包括其内部调用的方法所占用真实时间百分比 |
Excl Real Time% | 某个方法不包括其内部调用的方法所占用真实时间百分比 |
Calls + Recur Calls / Total | 某个方法次数+递归调用次数 |
Cpu Time / Call | 该方法平均占用CPU时间 |
Cpu Time / Call | 该方法平均占用真实时间 |
Incl Cpu Time | 某个方法包括其内部调用的方法所占用CPU时间 |
Excl Cpu Time | 某个方法不包括其内部调用的方法所占用CPU时间 |
Incl Real Time | 某个方法包括其内部调用的方法所占用真实时间 |
Excl Real Time | 某个方法不包括其内部调用的方法所占用真实时间 |
因为我们用sleep方法来进行耗时操作,所以这里我们可以单击Incl Real Time来进行降序排列。其中有很多系统调用的方法,我们来进行一一过滤。最终我们发现了CoordinatorLayoutActivity的initView方法Incl Real Time的时间为1000.493ms,这显然有问题,如下图所示。
从图中我们可以看出是调用sleep方法导致的耗时。关于Traceview还有很多种分析情况,就需要大家在平时进行积累了。
好了关于绘制性能分析,就讲到这,如果觉得不过瘾,本系列的后续文章还有大波的内容会持续向你砸来。
Android绘制优化(一)绘制性能分析的更多相关文章
- Python 优化第一步: 性能分析实践 使用cporfile+gprof2dot可视化
拿来主义: python -m cProfile -o profile.pstats to_profile.py gprof2dot -f pstats profile.pstats |dot -Tp ...
- 浅谈Unity的渲染优化(1): 性能分析和瓶颈判断(上篇)
http://www.taidous.com/article-667-1.html 前言 首先,这个系列文章做个大致的介绍,题目"浅谈Unity",因为公司和国内大部分3D手游开发 ...
- Android开发之Java集合类性能分析
对于Android开发者来说深入了解Java的集合类很有必要主要是从Collection和Map接口衍生出来的,目前主要提供了List.Set和 Map这三大类的集合,今天Android吧(ard8. ...
- Android中RelativeLayout和LinearLayout性能分析
先看一些现象吧:用eclipse或者Android studio,新建一个Activity自动生成的布局文件都是RelativeLayout,或许你会认为这是IDE的默认设置问题,其实不然,这是由 a ...
- Android -------- RelativeLayout 和 LinearLayout 的性能分析
布局的绘制角度 RelativeLayout不如LinearLayout快的根本原因是: RelativeLayout需要对其子View进行两次measure过程, 而LinearLayout则只需一 ...
- unity直连android真机在Profiler性能分析测试
基础步骤: 1.Unity打开你要测试的项目:File–Build Settings 2.如下图,按图顺序进行1.2.3.4.5操作,如果做过了,2就是灰色的,不能被点击,4和5需要相对应. 3.确保 ...
- Linux性能优化:CPU性能分析工具--vmstat
Blog:博客园 个人 目录 参数说明 输出信息说明 procs memory swap io system cpu 示例 vmstat是Virtual Meomory Statistics(虚拟内存 ...
- Android内存优化杂谈
Android内存优化是我们性能优化工作中比较重要的一环,这里其实主要包括两方面的工作: 优化RAM,即降低运行时内存.这里的目的是防止程序发生OOM异常,以及降低程序由于内存过大被LMK机制杀死的概 ...
- Python性能分析
Python性能分析 https://www.cnblogs.com/lrysjtu/p/5651816.html https://www.cnblogs.com/cbscan/articles/33 ...
随机推荐
- java基础-2
java基础-2 面向对象 定义 面向对象是一种思维方式,相对于面向过程面向过程注重流程中的每一步,清楚流程中的每一个细节面向对象注重的是对象,有了对象就有对象的一届自己动手做--面向过程,找其 ...
- IntelliJ IDEA如何设置新建类时,自动注释作者信息和日期时间
本文提供两种注释风格供参考. 风格1:简约Style 效果如下: 设置步骤: File--> Settings--> Editor--> File and Code Template ...
- 基于.net core 2.0+mysql+AceAdmin搭建一套快速开发框架
前言 .net core已经出来一段时间了,相信大家对.net core的概念已经很清楚了,这里就不再赘述.笔者目前也用.net core做过一些项目,并且将以前framework下的一些经验移植到了 ...
- 流式大数据计算实践(2)----Hadoop集群和Zookeeper
一.前言 1.上一文搭建好了Hadoop单机模式,这一文继续搭建Hadoop集群 二.搭建Hadoop集群 1.根据上文的流程得到两台单机模式的机器,并保证两台单机模式正常启动,记得第二台机器core ...
- react入门学习及总结
前言 不知不觉一年又过去了,新的一年又到来,2019应该要好好思考,好好学点有用的东西,规划下自己今后的学习方向,不要再像以前那样感觉很迷茫. react简单介绍 官网及中文文档 https://re ...
- 使用Python进行并发编程
让计算机程序并发的运行是一个经常被讨论的话题,今天我想讨论一下Python下的各种并发方式. 并发方式 线程(Thread) 多线程几乎是每一个程序猿在使用每一种语言时都会首先想到用于解决并发的工具( ...
- 深入理解Java虚拟机阅读心得(三)
Java中提倡的自动内存管理最终可以归结为自动化的解决两个问题: 给对象分配内存 回收分配给对象的内存 先说说回收这一方面的两个主要知识点 一.垃圾收集算法 1.标记-清理算法 首先标记出所有需要回收 ...
- Perl子程序引用和匿名子程序
子程序也有引用,也有匿名子程序.假设你已经具备了数组.hash的引用知识,所以这里简单介绍一下. $ref_sub = \&mysub; # 子程序引用,&符号必须不能少 &{ ...
- MySQL系列详解十:MySQL多源复制演示-技术流ken
前言 多源复制即多主一从结构,多个主服务器端的数据都会同步到后端一个从服务器上面.至于为什么要做多源复制下面的总结很到位. 1.灾备作用:将各个库汇总在一起,就算是其他库都挂了(整个机房都无法连接了) ...
- 前端(二)之 CSS
前端之 CSS 前言 昨天学习了标记式语言,也就是无逻辑语言.了解了网页的骨架是什么构成的,了解了常用标签,两个指令以及转义字符:其中标签可以分为两大类: 一类是根据标签内容可以分类单双标签,单标签指 ...