互联网巨头们的 SRE 运维实践「GitHub 热点速览 v.21.27」

作者:HelloGitHub-小鱼干
本周大热点无疑是前几天 GitHub 发布的 Copilot,帮你补全代码,给你的注释提出建议,预测你即将使用的代码组件…如此神奇的 AI 技术,恰巧本周微软也开源了他们的机器学习入门课程,你在 12 周之内完成 24 堂课程即可入门机器学习。除此之外,本周的特点主题之一 DevOps 和 SRE,包括 Google、百度在内的多家科技公司在本周特推给出了他们的最佳实践。
以下内容摘录自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 热帖(简称 HN 热帖),选项标准:新发布 | 实用 | 有趣,根据项目 release 时间分类,发布时间不超过 14 day 的项目会标注 New,无该标志则说明项目 release 超过半月。由于本文篇幅有限,还有部分项目未能在本文展示,望周知
- 本文目录
- 本周特推
- 1.1 监控工具:signoz
- 1.2 SRE 指南:howtheysre
- GitHub Trending 周榜
- 2.1 devops 练习:devops-exercises
- 2.2 高效并行策略:mesh-transformer-jax
- 2.3 安全私有网络:wiretrustee
- 2.4 微软机器学习课:ML-For-Beginners
- 2.5 树莓派路由器:internet-pi
- 往期回顾
1. 本周特推
1.1 监控工具:signoz
本周 star 增长数:1,350+
SigNoz 可帮助开发人员监控应用以及排除故障问题,是 DataDog、NewRelic 等产品的开源替代品。特性:
- 支持应用 metric 指标,例如:P50、P90、P99 延迟和错误率;
- 应用中最慢的端点;
- 精准的请求跟踪;
- 根据服务名称、延迟、错误、注释进行筛选;
- 统一指标和跟踪,你无需在 Prometheus 和 Jaeger 间切换来定位问题。
GitHub 地址→https://github.com/SigNoz/signoz

1.2 SRE 指南:howtheysre
本周 star 增长数:1,600+
howtheysre 记录了国内外各地的技术团队、组织是如何实践站点可靠性工程(SRE,全称 Site Reliability Engineering),这些团队包括 Atlassian、百度、Google、Netflix 在内的 50+ 公司。
GitHub 地址→https://github.com/upgundecha/howtheysre

2. GitHub Trending 周榜
2.1 devops 练习:devops-exercises
本周 star 增长数:1,800+
Devops-exercises 收录了大量运维、SRE 人员需要掌握的知识,包括 Linux、Jenkins、AWS、Prometheus、Docker、Python、K8s 在内的 20 多个技术领域的练习。

2.2 高效并行策略:mesh-transformer-jax
本周 star 增长数:800+
Mesh Transformer JAX 一个利用 Jax 的 xmap 运算符实现并行机制的 haiku 库。这个库的设计目的是在 TPUv3s 上最多可伸缩到大约 20B 参数,超越了其他的并行策略,如 GPT-NeoX 或 DeepSpeed。
GitHub 地址→https://github.com/kingoflolz/mesh-transformer-jax

2.3 安全私有网络:wiretrustee
本周 star 增长数:700+
Wiretrustee 可将设备连接到一个单独的私人网络,可在 ARM 设备,例如 树莓派上运行。

2.4 微软机器学习课:ML-For-Beginners
本周 star 增长数:2,100+
ML-For-Beginners 是微软开源的机器学习课程,你可在 12 周上完他们安排的 24 节机器学习相关课程。

2.5 树莓派路由器:internet-pi
本周 star 增长数:300+
New internet-pi 是一个用树莓派配置网络环境的工具,它将 DNS、广告屏蔽、监控等配置到了一个 Ansible 项目中。

3. 往期回顾
以上为 2021 年第 26 个工作周的 GitHub Trending 如果你 Pick 其他好玩、实用的 GitHub 项目,记得来 HelloGitHub issue 区和我们分享下哟
HelloGitHub 交流群现已全面开放,添加微信号:HelloGitHub001 为好友入群,可同前端、Java、Go 等各界大佬谈笑风生、切磋技术~
关注 HelloGitHub 公众号 第一时间收到更新。
还有更多开源项目的介绍和宝藏项目等待你的发现。
互联网巨头们的 SRE 运维实践「GitHub 热点速览 v.21.27」的更多相关文章
- GitHub 热点速览 Vol.23:前后端最佳实践
作者:HelloGitHub-小鱼干 摘要:最佳实践,又名 best-practices,是 GitHub 常见的项目名,也是本周 Trending 关键词.25 年 Python 开发经验的 Dav ...
- vivo大规模 Kubernetes 集群自动化运维实践
作者:vivo 互联网服务器团队-Zhang Rong 一.背景 随着vivo业务迁移到K8s的增长,我们需要将K8s部署到多个数据中心.如何高效.可靠的在数据中心管理多个大规模的K8s集群是我们面临 ...
- HBase运维实践-聊聊RIT的那点事
相信长时间运维HBase集群的童鞋肯定都会对RIT(Region-In-Transition,很多参考资料误解为Region-In-Transaction,需要注意)有一种咬牙切齿的痛恨感,一旦Reg ...
- 关于Prometheus运维实践项目
关于Promethues运维实践项目 1. 什么是Prometheus运维实践项目 是什么 Prometheus,普罗米修斯,是古希腊神话中为人间带来火种的神. Prometheus运维实 ...
- elasticsearch基本概念理解+elasticsearch 的shards unassigned处理方法 -- 最佳运维实践 - 集群规划
1.es与MySQL的概念对比 2.概念理解 2.1 Index : 一个索引即是文档的集合 2.2 Document : 一个文档即是一个可被索引的基础单元信息,一条记录: 2.3 Replicas ...
- 华为刘腾:华为终端云Cassandra运维实践分享
点击此处观看完整活动视频 各位线上的嘉宾朋友大家好,我是来自华为消费者BG云服务部的刘腾,我今天给大家分享的主题是华为终端云Cassandra运维实践.和前面王峰老师提到的Cassandra在360中 ...
- 谷歌SRE运维模式解读
谷歌SRE运维模式解读 前面我和你分享了一些关于运维组织架构和协作模式转型的内容,为了便于我们更加全面地了解先进的运维模式,今天我们再来谈一下谷歌的SRE(Site Reliability Engin ...
- 阿里智能运维实践|阿里巴巴DevOps实践指南
编者按:本文源自阿里云云效团队出品的<阿里巴巴DevOps实践指南>,扫描上方二维码或前往:https://developer.aliyun.com/topic/devops,下载完整版电 ...
- 基于.net的微服务架构的开发测试环境运维实践
眼下,做互联网应用,最火的架构是微服务,最热的研发管理就是DevOps, 没有之一.微服务.DevOps已经被大量应用,它们已经像传说中的那样,可以无所不能.特来电云平台,通过近两年多的实践,发现完全 ...
随机推荐
- Jmeter(四十五) - 从入门到精通高级篇 - Jmeter之网页爬虫-上篇(详解教程)
1.简介 上大学的时候,第一次听同学说网页爬虫,当时比较幼稚和懵懂,觉得就是几只电子虫子爬在网页上在抓取东西.后来又听说写代码可以实现网页爬虫,宏哥感觉高大上,后来工作又听说,有的公司做爬虫被抓的新闻 ...
- [Java] 数据分析--统计
二项分布 需求:5个四面体筛子,筛子三面绿色,一面红色,模拟1000000次,统计每次试验红色落地筛子个数的分布 实现:用循环实现5个筛子和1000000次试验,定义函数numRedDown模拟5个筛 ...
- Zabbix 监控介绍
Zabbix 监控介绍 1.Zabbix监控架构 2.Zabbix 优点 开源无软件成本投入 Server对设备性能要求低 支持设备多,自带多种监控模板 支持分布式集中管理,有自动发现功能,可以实现自 ...
- 说明位图,矢量图,像素,分辨率,PPI,DPI?
说明位图,矢量图,像素,分辨率,PPI,DPI? 显示全部 关注者 28 被浏览 7,031 关注问题写回答 邀请回答 添加评论 分享 2 个回答 默认排序 刘凯 21 人赞同了 ...
- flink-cdc读取postgres报异常,没有发布表
异常信息 must be superuser to create FOR ALL TABLES publication 必须是超级用户才能为所有发布表创建 网上搜索了一天,都毫无头绪,后面搜索到了一个 ...
- redis 基本操作命令
redis 基本操作 String 操作字符串 1 SET key value 设置指定 key 的值 2 GET key 获取指定 key 的值. 3 GETRANGE key start ...
- AlertDailog中的which问题
在做一个AlertDialog的点击事件设置的时候: AlertDialog.Builder(this).apply { var numberIndex = 0 setTitle("choo ...
- RedisPool
class RedisPool(object): instance = None def __init__(self, host='192.168.2.129', port=7000, passwor ...
- 异步编程CompletableFuture
多线程优化性能,串行操作并行化 串行操作 // 以下2个都是耗时操作 doBizA(); doBizB(); 修改变为并行化 new Thread(() -> doBizA()).start() ...
- Yolo:实时目标检测实战(下)
Yolo:实时目标检测实战(下) YOLO:Real-Time Object Detection After a few minutes, this script will generate all ...