本文转载自:微信公众号-数列科技<二十问全链路压测干货汇总(上)> 最近几年全链路压测无疑成为了一个热门话题,在各个技术峰会上都可以看到它的身影. 一些大型的互联网公司,比如阿里巴巴.京东.滴滴等,都已将全链路压测应用到了生产环境. 笔者曾有幸深度参与到阿里巴巴全链路压测体系的建设,以及与阿里内部其他技术团队.物流.社交电商.品牌企业等CTO或者CIO技术交流之后, 关于如何保障企业数字化过程中的性能稳定方面,有了一个共识:全链路压测是建立IT性能管理体系的抓手和必选项. 1.什么样的公司需要…
京东金融移动端全链路压测历时三个月,测试和服务端同学经过无数日日夜夜,通宵达旦,终于完成了移动端链路的测试任务.整个测试有部分涉及到公司敏感数据,本文只对策略部分进行论述. 1.系统架构与策略 在聊性能测试之前,简单的对金融系统架构进行简单的梳理.京东金融App架构较为复杂,为了说明问题对架构进行简化和抽象. 金融App客户端主要是通过原生主框架和运营平台(乐高)配置搭建组成App客户端:主框架和运营平台(乐高)通过调用网关接口连接各个业务系统.实现整个业务正常运转.金融App移动端618专项测…
导读 2018年十一当天,高德DAU突破一个亿,不断增长的日活带来喜悦的同时,也给支撑高德业务的技术人带来了挑战.如何保障系统的稳定性,如何保证系统能持续的为用户提供可靠的服务?是所有高德技术人面临的问题,也是需要大家一起解决的问题. 高德业务规模 支撑一亿DAU的高德服务是什么体量?可能每个人的答案都不相同,这里从基础设施的角度给大家做个简单的介绍,我们有数千个线上应用,分别部署在全国各地多个机房中的数万台机器上. 这张图是高德业务核心链路的架构,从图中可以看出高德业务具有相当高的复杂性.当然…
背景 在美团的价值观中,以“客户为中心”被放在一个非常重要的位置,所以我们对服务出现故障越来越不能容忍.特别是目前公司业务正在高速增长阶段,每一次故障对公司来说都是一笔非常不小的损失.而整个IT基础设施非常复杂,包括网络.服务器.操作系统以及应用层面都可能出现问题.在这种背景下,我们必须对服务进行一次全方位的“体检”,从而来保障美团多个业务服务的稳定性,提供优质的用户服务体验.真正通过以下技术手段,来帮助大家吃的更好,生活更好: 验证峰值流量下服务的稳定性和伸缩性. 验证新上线功能的稳定性. 进…
自Takin社区版1.0发布两个多月以来,有很多测试同学陆续在各自的工作中运用了起来,其中包括金融.电商.物流.出行服务等行业.这个过程中我们收到了很多同学的反馈建议,同时也了解到很多同学在落地全链路压测过程中遇到了很多难点,比如: 链路调用关系复杂,梳理耗时容易遗漏: 安装部署比较麻烦,需要配置很多信息: 生产全链路压测风险较高,能否在测试环境落地? -- 上述问题都是全链路压测落地过程中不可避免的挑战,经过我们产品和研发小哥哥的不懈努力后,全新的Takin2.0终于来啦!这一次,我们的目标是…
摘要:全链路压测是应对电商大促容量规划最有效的手段,如何有效进行容量规划是其中的架构关键问题.京东在全链路压测方面做过多年尝试,本文转载京东商城基础平台技术专家文章,介绍其最新的自动化压测 ForceBot 体系. ForceBot愿景 1.诞生背景 伴随着京东业务的不断扩张,研发体系的系统也随之增加,各核心系统环环相扣,尤其是强依赖系统,上下游关系等紧密结合,其中一个系统出现瓶颈问题,会影响整个系统链路的处理性能,直接影响用户购物体验. 往年的 618.双 11 大促备战至少提前 3 个月时间…
什么是Takin? Takin是基于Java的开源系统,可以在无业务代码侵入的情况下,嵌入到各个应用程序节点,实现生产环境的全链路性能测试,适用于复杂的微服务架构系统. Takin核心原理图 Takin有什么特点? Takin具备以下4个特点: (1)业务代码0侵入:在接入.采集和实现逻辑控制时,不需要修改任何业务代码:(2)链路治理:能够帮助业务和微服务架构分析业务链路,以技术方式获得功能视角的链路信息:(3)性能瓶颈定位:性能测试结果可以直接展现整个链路中存在性能瓶颈的微服务架构节点:(4)…
原文:连接: https://tech.meituan.com/2018/09/27/quake-introduction.html 开源分布式监控Cat: https://github.com/dianping/cat…
6 月 25 日,国内知名的系统高可用专家数列科技宣布开源旗下核心产品能力,对外开放生产全链路压测平台产品的源代码,并正式命名为 Takin. 目前中国人寿.顺丰科技.希音.中通快递.中国移动.永辉超市.爱库存.浙江大学等 50+行业头部公司都采用了该技术,10 万+探针同时线上运行,每天实时处理数百亿条用户请求,生成数百 TB 链路数据.该项目已在 Github 上发布,作为全球首款开源的全链路压测平台,Takin 的开源将为更多企业提供超低门槛.超低成本.超高效率的性能保障能力. 什么是生产…
上篇文章跟大家介绍了TCP通信常见的前10个面试题,没看过的小伙伴可以点击下方链接进行查看: 上位机面试必备——TCP通信灵魂二十问[上] 今天就后面的10个面试题接着做下说明:欢迎关注[dotNet工控上位机]公众号:thinger_swj 11.四次挥手中的TIME_WAIT状态? 首先要明确一点:主动关闭连接的一方,才会有TIME_WAIT状态. 之所以需要TIME_WAIT状态,主要是两个原因: 防止相同的端口重新连接时,服务器收到的是停留在网络间的数据包 保证被动关闭连接的一方能被正确…