作者:HelloGitHub-小鱼干

本周大热点无疑是前几天 GitHub 发布的 Copilot,帮你补全代码,给你的注释提出建议,预测你即将使用的代码组件…如此神奇的 AI 技术,恰巧本周微软也开源了他们的机器学习入门课程,你在 12 周之内完成 24 堂课程即可入门机器学习。除此之外,本周的特点主题之一 DevOps 和 SRE,包括 Google、百度在内的多家科技公司在本周特推给出了他们的最佳实践。

以下内容摘录自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 热帖(简称 HN 热帖),选项标准:新发布 | 实用 | 有趣,根据项目 release 时间分类,发布时间不超过 14 day 的项目会标注 New,无该标志则说明项目 release 超过半月。由于本文篇幅有限,还有部分项目未能在本文展示,望周知

  • 本文目录

      1. 本周特推
      • 1.1 监控工具:signoz
      • 1.2 SRE 指南:howtheysre
      1. GitHub Trending 周榜
      • 2.1 devops 练习:devops-exercises
      • 2.2 高效并行策略:mesh-transformer-jax
      • 2.3 安全私有网络:wiretrustee
      • 2.4 微软机器学习课:ML-For-Beginners
      • 2.5 树莓派路由器:internet-pi
      1. 往期回顾

1. 本周特推

1.1 监控工具:signoz

本周 star 增长数:1,350+

SigNoz 可帮助开发人员监控应用以及排除故障问题,是 DataDog、NewRelic 等产品的开源替代品。特性:

  • 支持应用 metric 指标,例如:P50、P90、P99 延迟和错误率;
  • 应用中最慢的端点;
  • 精准的请求跟踪;
  • 根据服务名称、延迟、错误、注释进行筛选;
  • 统一指标和跟踪,你无需在 Prometheus 和 Jaeger 间切换来定位问题。

GitHub 地址→https://github.com/SigNoz/signoz

1.2 SRE 指南:howtheysre

本周 star 增长数:1,600+

howtheysre 记录了国内外各地的技术团队、组织是如何实践站点可靠性工程(SRE,全称 Site Reliability Engineering),这些团队包括 Atlassian、百度、Google、Netflix 在内的 50+ 公司。

GitHub 地址→https://github.com/upgundecha/howtheysre

2. GitHub Trending 周榜

2.1 devops 练习:devops-exercises

本周 star 增长数:1,800+

Devops-exercises 收录了大量运维、SRE 人员需要掌握的知识,包括 Linux、Jenkins、AWS、Prometheus、Docker、Python、K8s 在内的 20 多个技术领域的练习。

GitHub 地址→https://github.com/bregman-arie/devops-exercises

2.2 高效并行策略:mesh-transformer-jax

本周 star 增长数:800+

Mesh Transformer JAX 一个利用 Jax 的 xmap 运算符实现并行机制的 haiku 库。这个库的设计目的是在 TPUv3s 上最多可伸缩到大约 20B 参数,超越了其他的并行策略,如 GPT-NeoX 或 DeepSpeed。

GitHub 地址→https://github.com/kingoflolz/mesh-transformer-jax

2.3 安全私有网络:wiretrustee

本周 star 增长数:700+

Wiretrustee 可将设备连接到一个单独的私人网络,可在 ARM 设备,例如 树莓派上运行。

GitHub 地址→https://github.com/wiretrustee/wiretrustee

2.4 微软机器学习课:ML-For-Beginners

本周 star 增长数:2,100+

ML-For-Beginners 是微软开源的机器学习课程,你可在 12 周上完他们安排的 24 节机器学习相关课程。

GitHub 地址→https://github.com/microsoft/ML-For-Beginners

2.5 树莓派路由器:internet-pi

本周 star 增长数:300+

New internet-pi 是一个用树莓派配置网络环境的工具,它将 DNS、广告屏蔽、监控等配置到了一个 Ansible 项目中。

GitHub 地址→https://github.com/geerlingguy/internet-pi

3. 往期回顾

以上为 2021 年第 26 个工作周的 GitHub Trending 如果你 Pick 其他好玩、实用的 GitHub 项目,记得来 HelloGitHub issue 区和我们分享下哟

HelloGitHub 交流群现已全面开放,添加微信号:HelloGitHub001 为好友入群,可同前端、Java、Go 等各界大佬谈笑风生、切磋技术~


关注 HelloGitHub 公众号 第一时间收到更新。

还有更多开源项目的介绍和宝藏项目等待你的发现。

互联网巨头们的 SRE 运维实践「GitHub 热点速览 v.21.27」的更多相关文章

  1. GitHub 热点速览 Vol.23:前后端最佳实践

    作者:HelloGitHub-小鱼干 摘要:最佳实践,又名 best-practices,是 GitHub 常见的项目名,也是本周 Trending 关键词.25 年 Python 开发经验的 Dav ...

  2. vivo大规模 Kubernetes 集群自动化运维实践

    作者:vivo 互联网服务器团队-Zhang Rong 一.背景 随着vivo业务迁移到K8s的增长,我们需要将K8s部署到多个数据中心.如何高效.可靠的在数据中心管理多个大规模的K8s集群是我们面临 ...

  3. HBase运维实践-聊聊RIT的那点事

    相信长时间运维HBase集群的童鞋肯定都会对RIT(Region-In-Transition,很多参考资料误解为Region-In-Transaction,需要注意)有一种咬牙切齿的痛恨感,一旦Reg ...

  4. 关于Prometheus运维实践项目

    关于Promethues运维实践项目 1. 什么是Prometheus运维实践项目 ​ 是什么 ​ Prometheus,普罗米修斯,是古希腊神话中为人间带来火种的神. ​ Prometheus运维实 ...

  5. elasticsearch基本概念理解+elasticsearch 的shards unassigned处理方法 -- 最佳运维实践 - 集群规划

    1.es与MySQL的概念对比 2.概念理解 2.1 Index : 一个索引即是文档的集合 2.2 Document : 一个文档即是一个可被索引的基础单元信息,一条记录: 2.3 Replicas ...

  6. 华为刘腾:华为终端云Cassandra运维实践分享

    点击此处观看完整活动视频 各位线上的嘉宾朋友大家好,我是来自华为消费者BG云服务部的刘腾,我今天给大家分享的主题是华为终端云Cassandra运维实践.和前面王峰老师提到的Cassandra在360中 ...

  7. 谷歌SRE运维模式解读

    谷歌SRE运维模式解读 前面我和你分享了一些关于运维组织架构和协作模式转型的内容,为了便于我们更加全面地了解先进的运维模式,今天我们再来谈一下谷歌的SRE(Site Reliability Engin ...

  8. 阿里智能运维实践|阿里巴巴DevOps实践指南

    编者按:本文源自阿里云云效团队出品的<阿里巴巴DevOps实践指南>,扫描上方二维码或前往:https://developer.aliyun.com/topic/devops,下载完整版电 ...

  9. 基于.net的微服务架构的开发测试环境运维实践

    眼下,做互联网应用,最火的架构是微服务,最热的研发管理就是DevOps, 没有之一.微服务.DevOps已经被大量应用,它们已经像传说中的那样,可以无所不能.特来电云平台,通过近两年多的实践,发现完全 ...

随机推荐

  1. Jmeter(四十五) - 从入门到精通高级篇 - Jmeter之网页爬虫-上篇(详解教程)

    1.简介 上大学的时候,第一次听同学说网页爬虫,当时比较幼稚和懵懂,觉得就是几只电子虫子爬在网页上在抓取东西.后来又听说写代码可以实现网页爬虫,宏哥感觉高大上,后来工作又听说,有的公司做爬虫被抓的新闻 ...

  2. [Java] 数据分析--统计

    二项分布 需求:5个四面体筛子,筛子三面绿色,一面红色,模拟1000000次,统计每次试验红色落地筛子个数的分布 实现:用循环实现5个筛子和1000000次试验,定义函数numRedDown模拟5个筛 ...

  3. Zabbix 监控介绍

    Zabbix 监控介绍 1.Zabbix监控架构 2.Zabbix 优点 开源无软件成本投入 Server对设备性能要求低 支持设备多,自带多种监控模板 支持分布式集中管理,有自动发现功能,可以实现自 ...

  4. 说明位图,矢量图,像素,分辨率,PPI,DPI?

    说明位图,矢量图,像素,分辨率,PPI,DPI? 显示全部 关注者 28 被浏览 7,031 关注问题写回答 ​邀请回答 ​添加评论 ​分享 ​     2 个回答 默认排序 刘凯   21 人赞同了 ...

  5. flink-cdc读取postgres报异常,没有发布表

    异常信息 must be superuser to create FOR ALL TABLES publication 必须是超级用户才能为所有发布表创建 网上搜索了一天,都毫无头绪,后面搜索到了一个 ...

  6. redis 基本操作命令

    redis 基本操作 String 操作字符串 1 SET key value 设置指定 key 的值 ​ 2 GET key 获取指定 key 的值. ​ 3 GETRANGE key start ...

  7. AlertDailog中的which问题

    在做一个AlertDialog的点击事件设置的时候: AlertDialog.Builder(this).apply { var numberIndex = 0 setTitle("choo ...

  8. RedisPool

    class RedisPool(object): instance = None def __init__(self, host='192.168.2.129', port=7000, passwor ...

  9. 异步编程CompletableFuture

    多线程优化性能,串行操作并行化 串行操作 // 以下2个都是耗时操作 doBizA(); doBizB(); 修改变为并行化 new Thread(() -> doBizA()).start() ...

  10. Yolo:实时目标检测实战(下)

    Yolo:实时目标检测实战(下) YOLO:Real-Time Object Detection After a few minutes, this script will generate all ...