开源项目推荐

kptop

Kubernetes API 提供的监控指标非常有限,而 kubectl top 就是利用 Kubernetes API 来查看 Node 和 Pod 的实时资源使用情况。kptop 使用 Prometheus 作为数据源,不仅可以在终端上显示 Node 和 Pod 的资源使用情况,还可以显示 Container 和 PVC 资源的使用情况。

kube-reqsizer

kube-reqsizer 是 VPA 的替代品,它会监测 Pod 在一段时间内的资源使用情况,并根据这段时间的平均值来自动调整工作负载的 Requests。

Kueue

Kueue 是一个开源作业队列控制器,旨在将批处理作业作为一个单元进行管理。 Kueue 将 Pod 级编排留给 Kubernetes 现有的稳定组件。 Kueue 原生支持 Kubernetes Job API, 并提供用于集成其他定制 API 以进行批处理作业的钩子。

文章推荐

文件系统是如何影响到 Etcd 性能的?

这篇文章描述了如何通过修改 ext4 文件系统的选项来缓解磁盘延迟对 Etcd 集群的影响。作者使用了三个虚拟机进行测试,并发现在修改 ext4 的部分参数后,磁盘延迟显著降低。

现代应用可观测性的困境

这篇文章讨论了在微服务架构中,通过监控、日志和追踪来实现可观测性的重要性。这些技术可以帮助我们理解系统的行为并快速排除故障。文章还提出了几个工具,如 Jaeger 和 Zipkin,可以帮助我们收集和分析这些数据。

云原生动态

Gorilla Toolkit 开源项目被废弃

多年来,Gorilla Web Toolkit 是一个流行的、开源的 Go 工具箱,用于基于网络的应用程序。它由一些软件包组成,这些软件包增强了Go的基础库,以增加重要的功能,如参数化路由和会话管理。尤其是它的网络请求路由器 mux,一直非常受欢迎,mux 在超过 90,000 个软件库中使用。它在 Cilium、Istio 和 Open Policy Agent 等顶级项目中被调用执行任务。事实上,Gorilla 的 WebSocket 库甚至被用于 Kubernetes 中。然而,该项目现在已经被废弃了。

GitLab 发布基于 Visual Studio Code 的 Web IDE beta

GitLab 已基于微软的开源 Visual Studio Code 重建其 Web IDE,新的 Web IDE 被描述为 Beta,但现在是 GitLab 的默认版本。用户将自动获得它(尽管可以选择退出)。自我管理的用户将在定于 12 月 22 日发布的 15.7 版本中获得新的编辑器,不过在这种情况下,它将被放在一个功能标志后面。令人失望的是,它不支持 VS Code 扩展,无论是来自官方的 VS Code 市场,还是来自无障碍的 Open VSX 注册表。

Devbox 0.2.0 发布

Devbox 0.2.0 发布,此版本是迄今为止最大的版本之一,包含旨在帮助开发人员启动和运行基于 Nix 的开发环境的功能。

此版本中包含的一些功能包括:

  • 自动 Nix 安装程序:Devbox 现在可以检测您的机器上是否安装了 Nix,并会在需要时自动为您安装。
  • Devbox Plugins:一个用于自动配置包的框架,最初支持 Apache、Nginx、PostgreSQL 等。
  • Devbox 服务:使用单个命令管理项目的后台服务(如服务器和数据库)。
  • 生成 Dockerfile 和 Devcontainers:需要在 Docker 中运行您的环境?直接从 CLI 生成 Dockerfile 或 devcontainer.json。

NVIDIA Kubernetes 设备插件带来 Temporal GPU 并发

从 v0.12 版本开始,NVIDIA 设备插件框架开始支持 Kubernetes 上容器的 CUDA 工作负载之间的时间分片 GPU 共享。此功能旨在防止 GPU 单元利用率不足,并通过利用时分复用 CUDA 上下文更轻松地扩展应用程序。在正式发布之前,插件的一个分支启用了这种时间并发。

随着 Kubernetes 成为事实上的扩展服务平台,NVIDIA 也开始通过设备插件将原生并发机制整合到集群中。对于 Ampere 及之后的 GPU 型号(如 A100), K8s 设备插件已经支持多实例 GPU 并发。最新添加到列表中的是通过时间切片 API 实现的时间并发。另一方面,对于 Volta 和后来的 GPU 架构,插件团队尚未开发 MPS 支持。

本文由博客一文多发平台 OpenWrite 发布!

云原生周刊 | 使用 kube-reqsizer 自动调整资源配额的更多相关文章

  1. 使用 Iceberg on Kubernetes 打造新一代云原生数据湖

    背景 大数据发展至今,按照 Google 2003年发布的<The Google File System>第一篇论文算起,已走过17个年头.可惜的是 Google 当时并没有开源其技术,& ...

  2. DTCC 2020 | 阿里云李飞飞:云原生分布式数据库与数据仓库系统点亮数据上云之路

    简介: 数据库将面临怎样的变革?云原生数据库与数据仓库有哪些独特优势?在日前的 DTCC 2020大会上,阿里巴巴集团副总裁.阿里云数据库产品事业部总裁.ACM杰出科学家李飞飞就<云原生分布式数 ...

  3. .NET团队送给.NET开发人员的云原生学习资源

    企业正在迅速采用云的功能来满足用户需求,提高应用程序的可伸缩性和可用性.要完全拥抱云并优化节约成本,就需要在设计应用程序时考虑到云的环境,也就是要用云原生的应用开发方法.这意味着不仅要更改应用程序的构 ...

  4. 混部之殇-论云原生资源隔离技术之CPU隔离(一)

    作者 蒋彪,腾讯云高级工程师,10+年专注于操作系统相关技术,Linux内核资深发烧友.目前负责腾讯云原生OS的研发,以及OS/虚拟化的性能优化工作. 导语 混部,通常指在离线混部(也有离在线混部之说 ...

  5. .NET平台系列31:.NET团队送给.NET开发人员的云原生学习资源汇总

    系列目录     [已更新最新开发文章,点击查看详细] .NET Core 启动于2016年,跟K8S同年诞生,既拥有着悠久的历史积累,又集成了当下最新的设计理念,加上.NET团队持续对容器技术的官方 ...

  6. 成本降低40%、资源利用率提高20%的 AI 应用产品云原生容器化之路

    作者 郭云龙,腾讯云高级工程师,目前就职于 CSIG 云产品三部-AI 应用产品中心,现负责中心后台业务框架开发. 导语 为了满足 AI 能力在公有云 SaaS 场景下,服务和模型需要快速迭代交付的需 ...

  7. 全球首个开放应用模型 OAM 开源 | 云原生生态周报 Vol. 23

    作者 | 临石.元毅.冬岛.衷源.天元 业界要闻 全球首个开放应用模型 OAM 开源 2019 年 10 月 17 日,阿里巴巴合伙人.阿里云智能基础产品事业部总经理蒋江伟(花名:小邪)在 Qcon ...

  8. 面向云原生的混沌工程工具-ChaosBlade

    作者 | 肖长军(穹谷)阿里云智能事业群技术专家   导读:随着云原生系统的演进,如何保障系统的稳定性受到很大的挑战,混沌工程通过反脆弱思想,对系统注入故障,提前发现系统问题,提升系统的容错能力.Ch ...

  9. 云原生应用管理,像管理手机APP一样管理企业应用

    我们在使用智能手机的时候,手机APP从应用市场一键安装,安装好即点即用,当有新版本一键升级,如果不想用了长按图标删除,整个过程非常简单,小朋友都能熟练掌握.而对于企业应用,由于结构复杂.可用性要求高. ...

  10. AMS 新闻视频广告的云原生容器化之路

    作者 卓晓光,腾讯广告高级开发工程师,负责新闻视频广告整体后台架构设计,有十余年高性能高可用海量后台服务开发和实践经验.目前正带领团队完成云原生技术栈的全面转型. 吴文祺,腾讯广告开发工程师,负责新闻 ...

随机推荐

  1. 训练人形机器人时如何收集人类行为数据 —— 通过人来训练机器人(真人实际演示动作)or 仿真环境自动生成 —— 哪种方式更优、更可行呢

    特斯拉的老马,搞的optimus人形机器人就是通过人来训练机器人(真人实际演示动作),但是未来使用仿真环境自动生成数据是否可行呢,NVIDIA的老黄在2024 GTC上是大力推出自家的GROOT平台, ...

  2. python报错:`visualize_sharding` requires `rich` to be installed.

    Rich是python的一个绘图library,需要手动安装. 解决方法: pip install Rich

  3. ubuntu系统conda下运行pytorch报错:ImportError: libopenblas.so.0: cannot open shared object file

    如题: ubuntu系统conda下运行pytorch报错:ImportError: libopenblas.so.0: cannot open shared object file 网上找了一些资料 ...

  4. 在vscode中通过修改launch.json文件为项目添加启动参数——在launch.json文件中修改args变量

    以前一直在使用pycharm,不管怎么说毕竟国内外的Python编程者大部分都更支持pycharm,并且认为pycharm是Python语言编程中最好用的编辑器,但是随着国内编程人员一茬一茬的兴起很多 ...

  5. 关于我升级VS16.8,结果一些项目运行报错“Phx.FatalError”这件事

    背景 不知道啥时候开始,一些的项目不能好好运行了.一运行就报错 解决办法 https://developercommunity.visualstudio.com/content/problem/125 ...

  6. awk批量提取序列

    在提取前需保证序列文件仅有一列! awk '{print$1}' input.fa > ouput.fa#就可将ID后面的其余注释信息去掉,仅保留ID 1 awk -F '>' 'NR=F ...

  7. 使用 python flask 框架实现一个简单的抽奖系统

    Flask 实现一个简易的抽奖系统 项目前置知识 目前 python主流的框架: Django .flask .Tornado 简介: 1.框架 框架? 为什莫使用框架? (前置知识讲解比较冗杂,望谅 ...

  8. 十五分钟两百行代码,手写一个vue项目全局通用的弹框

    前言: 我们在写vue项目时,弹框是非常常用的组件,并且在同一个项目中,弹框大多类似.所以我们可以抽离封装出一个通用的弹框: 因为vue3可向下兼容,所以作者这边会使用vue2的写法,vue3写法大同 ...

  9. k8s-使用Network Policies实现网络隔离

    一.需求 Kubernetes 的命名空间主要用于组织和隔离资源,但默认情况下,不同命名空间中的 Pod 之间是可以相互通信的.为了实现更严格的网络隔离,同一套k8s需要根据不同的命名空间进行网络环境 ...

  10. 本地部署 Overleaf 服务

    ️ 注意:本教程只适用于 macOS / Linux 操作系统.如果需要在 Windows 上部署 Overleaf,请先安装 WSL,之后在 WSL 中部署 Overleaf . 本地部署 Over ...