开篇词|SRE是解决系统稳定性问题的灵丹妙药吗? https://time.geekbang.org/column/article/212686 这两年,近距离地接触了很多不同类型.不同规模的企业 IT 团队,我发现他们为了提升用户价值的交付效率,都在积极采用微服务.容器,以及其他的分布式技术和产品,而且也在积极引入像 DevOps 这样的先进理念.这些公司选择了正确的架构演进方向和交付理念,效率自然是提升了一大截.这样的情况,是不是也发生在你的公司.发生在你自己身上?这时候你会发现,效率提升了…
Atitit.增强系统稳定性----虚拟内存的设置 1.1. 读取虚拟内存配置1 1.2. 禁止虚拟内存1 1.3. 默认所有驱动器虚拟内存1 1.4. 设置c d盘虚拟内存为系统管理1 1.5. 设置d盘大小2g--3g1 1.1. 读取虚拟内存配置 [HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Session Manager\Memory Management] 1.2. 禁止虚拟内存 "PagingFiles"=hex(…
目录 1:简介 2:怎么抓取和分析log 3:怎么确定问题点 简介 系统稳定性目前主要是解决系统死机重启. 分为两部分:Android /kernel Kernel 分析需要的文件和工具: Mtklog, vmlinux ,gat工具,解析vmlinux的脚本. Vmlinux路径:alps\out\target\product\k55v1_64_op01_pre\obj\KERNEL_OBJ 解析vmlinux的脚本 ARM 32位版本:prebuilts/gcc/linux-x86/arm/…
文章都为原创,转载请注明出处,未经允许而盗用者追究法律责任.很久之前写的了,留着有点浪费,共享之.编写者:李文栋  如果你是一个Android应用程序开发人员,你的人生中不可避免的三件事情是:死亡.缴税和ANR.这么说是夸张了,但是由于Android本身的设计,以及应用程序和系统在开发过程中的缺陷,经常会在测试过程中遇到各种各样的ANR问题.在功能性的测试中还少一些,主要是在压力测试中(例如Monkey测试)会遇到非常多的ANR问题.本章的目的就是汇总笔者在工作中遇到的各种ANR问题,将其归纳总…
最近阅读了<SRE Google运维解密>的第23章,有一些感触,记录一下. 日常工作中,我们经常需要一些服务分布式的运行.跨区域如跨城.跨洲部署运行分布式系统往往是容易的,但是如何保证各系统间状态的一致是困难的.如何保证服务的高可靠.高可用,就是服务提供的数据是准确的,关键在于一些状态的传递,这个时候就需要利用分布式共识系统来维护相关状态,确保大家拿到的状态信息最终是一致的. 要想实现一个分布式共识系统,需要采用一些经过理论验证的方案,最基础的就是CAP理论. CAP 理论 CAP原则是指对…
文章都为原创,转载请注明出处,未经允许而盗用者追究法律责任.很久之前写的了,留着有点浪费,共享之.编写者:李文栋  http://rayleeya.iteye.com/blog/1955652 如果你是一个Android应用程序开发人员,你的人生中不可避免的三件事情是:死亡.缴税和ANR.这么说是夸张了,但是由于Android本身的设计,以及应用程序和系统在开发过程中的缺陷,经常会在测试过程中遇到各种各样的ANR问题.在功能性的测试中还少一些,主要是在压力测试中(例如Monkey测试)会遇到非常…
http缓存 HTTP请求的过程 从在浏览器地址栏敲入域名-DNS解析-实际IP-(中间可能多个代理服务器分发)- 源服务器,请求抵达源服务器后,在服务器上找到请求的资源,再通过代理服务器一层层的返回数据到浏览器端. http缓存三要素 缓存存储策略 用来确定http响应内容是否可以被客户端缓存,以及被哪些客户端缓存 对 于 Cache-Control 头里的 Public.Private.no-cache.max-age .no-store 他们都是用来指明响应内容是否可以被客户端存储的,其中…
1.引言 所谓的消息推送就是从服务器端向移动终端发送连接,传输一定的信息.比如一些新闻客户端,每隔一段时间收到一条或者多条通知,这就是从服务器端传来的推送消息:还比如常用的一些IM软件如微信.GTalk等,都具有服务器推送功能. 推送方法如下: 1)通过SMS进行服务器端和客户端的交流通信. 在Android平台上,你可以通过拦截SMS消息并且解析消息内容来了解服务器的意图,可以实现完全的实时操作.但是问题是这个方案的成本相对比较高,且依赖于运营商. 2)循环主动定时获取 这种方法需要客户端来做…
背景描述: 最近一个项目的系统管理员和业务运维人员分别反馈问题: 1.应用系统每个月会有一两次宕机,需要管理员手工重启IIS: 2.财务模块一个功能经常报网络错误“网络异常,请检查网络连接”“Unable to read data from the transport connection: 远程主机强迫关闭了一个现有的连接.” 财务组开发人员联系到我,他按照常规排除法,测试反馈:在应用服务器访问本机也会出现上面提到的网络问题. 异常信息(异常类型:System.Net.WebException…
编写者:李文栋P.S. OpenOffice粘贴过来后格式有些混乱. 1.2 如何分析ANR问题 引起ANR问题的根本原因,总的来说可以归纳为两类: 应用进程自身引起的,例如: 主线程阻塞.挂起.死循环 应用进程的其他线程的CPU占用率高,使得主线程无法抢占到CPU时间片 其他进程间接引起的,例如: 当前应用进程进行进程间通信请求其他进程,其他进程的操作长时间没有反馈 其他进程的CPU占用率高,使得当前应用进程无法抢占到CPU时间片 分析ANR问题时,以上述可能的几种原因为线索,通过分析各种日志…