6 月 25 日,国内知名的系统高可用专家数列科技宣布开源旗下核心产品能力,对外开放生产全链路压测平台产品的源代码,并正式命名为 Takin. 目前中国人寿.顺丰科技.希音.中通快递.中国移动.永辉超市.爱库存.浙江大学等 50+行业头部公司都采用了该技术,10 万+探针同时线上运行,每天实时处理数百亿条用户请求,生成数百 TB 链路数据.该项目已在 Github 上发布,作为全球首款开源的全链路压测平台,Takin 的开源将为更多企业提供超低门槛.超低成本.超高效率的性能保障能力. 什么是生产…
什么是Takin? Takin是基于Java的开源系统,可以在无业务代码侵入的情况下,嵌入到各个应用程序节点,实现生产环境的全链路性能测试,适用于复杂的微服务架构系统. Takin核心原理图 Takin有什么特点? Takin具备以下4个特点: (1)业务代码0侵入:在接入.采集和实现逻辑控制时,不需要修改任何业务代码:(2)链路治理:能够帮助业务和微服务架构分析业务链路,以技术方式获得功能视角的链路信息:(3)性能瓶颈定位:性能测试结果可以直接展现整个链路中存在性能瓶颈的微服务架构节点:(4)…
(18)When in production, carefully consider what you need to log 招数18: 在生产环境,仔细考虑你需要记录哪些日志 Many people deploy to production without checking how logging is currently configured. It is always advisable to check whether your policy is to have logging on…
经过 3 个 RC 版本的社区体验之后,Nacos 正式发布 1.0.0 GA 版本,在架构.功能和 API 设计上进行了全方位的重构和升级. 1.0.0 版本的发布标志着 Nacos 已经可以大规模的在生产环境中使用,新版本不仅针对社区的需求和集群的稳定性相应地增加了一些新特性,而且还发布了服务发现模块的性能测试报告,以及完整的 API 列表和架构设计文档. Nacos演进历程 Nacos 自 2018 年 7 月份开源以来,有赖于社区的大力关注和参与,在不到一年的时间里,已经演进了 10+…
上一篇文章,介绍了这个架构中,WebServer的选择,以及整个架构中扩展时的思路. 原文地址:15分钟从零开始搭建支持10w+用户的生产环境(三)   五.架构实践 前边用了三篇文章,详细介绍了这个架构的各个部分的选择以及安装. 这篇文章,我会用一个Demo项目,从开发到部署,包括MongoDB数据的访问.用这种方式过一遍这个架构.   Demo项目,我们用Dotnet Core开发.我们选择最新版的Dotnet Core 3.1做为系统的主框架. 开发环境用MacOS + VS Code,生…
背景 NanoProfiler是一个EF Learning Labs出品的免费性能监控类库(即将开源).它的思想和使用方式类似于MiniProfiler的.但是,设计理念有较大差异. MiniProfiler更像是一个面向开发和测试环境的性能监控类库,它的关注点(我说的不一定对,仅代表一家之言),更多的是提供了对微软的ASP.NET MVC,EntityFramework,WCF等主流前后端类库的封装和整合,如果你的项目恰巧从前端到后端都用到这些类库,它可以将从前端到后端的性能监控数据合并到一个…
上期回顾 上一期:NanoProfiler - 适合生产环境的性能监控类库 之 基本功能篇 上次介绍了NanoProfiler的基本功能,提到,NanoProfiler实现了MiniProfiler欠缺的多线程和异步代码的支持,并且,由于采用不同的内部数据结构,NanoProfiler拥有更高的执行效率,而且占用极少的系统资源,因此,是适合在生产环境下使用的性能监控类库.并且,我们也提到了,NanoProfiler设计理念的另一大不同,即面向大数据分析. 这一期,我重点介绍一下NanoProfi…
上期回顾 上一期:NanoProfiler - 适合生产环境的性能监控类库 之 大数据篇 上次介绍了NanoProfiler的大数据分析理念,一晃已经时隔一年多了,真是罪过! 有朋友问到何时开源的问题,这里先简单说明一下.因为是单位的项目,虽然单位的目标肯定是要开源的,但是,毕竟不像个人项目那么自由.一方面要保证代码本身的质量,另一方面也要剥离对单位其他框架类库的依赖,一忙起来就拖延日久了,我只能说尽力尽快推动这个事情!不过,Nuget package一直在Nuget.org,可以免费使用的.想…
这个工具的使用和 HeapAnalyzer 一样,非常容易,同样提供了详细的 readme 文档,这里也简单举例如下: #/usr/java50/bin/java -Xmx1000m -jar jca37.jar 图 2. 通过 xManager 工具登录到 AIX 服务器上打开 jca 的效果图 笔者直接在生产环境下直接通过它对产生的 javacore 文件进行分析,令人惊喜的是,其分析结果非常明了,笔者心头的疑云在对结果进行进一步分析核实后也渐渐散去. 图 3. jca 对 javacore…
问题原因找到了,那就好办了. 找到阿里云技术人员,让他们强行给我们上架了一个共享代理模式的Redis. 并重新进行压力测试. 哦豁~ 开心,压力测试顺利,异常率大大降低实际为: 数据库DBA反馈,数据库收到很多请求处理,数据库开始正常工作.(之前都是,数据库连接满,但活跃连接只有1到5个). 数据库连接数在50到100之间波动,且基本都是活跃连接. NGINX和php那边都工作正常,服务器cpu压力下降.各项功能都平稳. 然后开始真真正正进行模拟生产用户数据压力测试: 生产环境数据如下: 高峰时…