kuberadm集群升级

升级kubernetes集群注意不能跨版本升级比如1.13.x 要先升级到1.14.x,不能直接升级到1.15.x 举例说明升级到1.15,和1.14有些参数不一样,具体看官网: https://kubernetes.io/docs/tasks/administer-cluster/kubeadm/kubeadm-upgrade-1-14/ https://kubernetes.io/docs/tasks/administer-cluster/kubeadm/kubeadm-upgrade-…

SqlServer跨集群升级

SqlServer跨集群升级 1.新Server的IP要和旧的在同一网段. 2.安装SQL SERVER(注意:排序要和以前的一样,更改TempDB位置) 3.开启防火墙,并打开1433和5022端口 4.开启DTC服务及防火墙对应的Rule,用于Linked Server等 5.DB配置 6.创建新集群. 一台新server --切换集群 ALTER SERVER CONFIGURATION SET HADR CLUSTER CONTEXT='ss.COM' --查看集群 select clu…

kubernetes集群升级的正确姿势

kubernetes社区非常活跃,每季度都会发布一个release.但是线上集群业务可用性要求较高,场景复杂,任何微小的变更都需要非常小心,此时跟随社区版本进行升级略显吃力.但是为了能够使用到最新的一些feature我们必须不定期进行一些升级操作,在经历了一次线上集群的升级操作,踩完一些坑之后,分享一些收获与感悟.原来的集群版本是1.10,为了提高GPU集群的资源利用率,需要在调度器层面支持一些抢占调度等新特性,所以升级到1.14,此次升级的集群规模不是特别大,但是有一些在线任务,还是需要慎重操…

Kubernetes 集群升级docker版本

Kubernetes 集群升级docker版本原则:升级完一台正常后再接着升下一台. Work Node 一.迁移上的pod(保证业务,但期间会出现抖动) kubectl drain $NODE --ignore-daemonsets --delete-local-data --force 迁移的过程中如果提示pod无法删除,则需要手动delete. 二.升级docker版本至18.09.9 1.停掉kubelet及docker服务 systemctl stop kubelet syste…

k8s集群升级

集群升级由于课程中的集群版本是 v1.10.0,这个版本相对有点旧了,最新版本都已经 v1.14.x 了,为了尽量保证课程内容的更新度,所以我们需要将集群版本更新.我们的集群是使用的 kubeadm 搭建的,我们知道使用 kubeadm 搭建的集群来更新是非常方便的,但是由于我们这里版本跨度太大,不能直接从 1.10.x 更新到 1.14.x,kubeadm 的更新是不支持跨多个主版本的,所以我们现在是 1.10,只能更新到 1.11 版本了,然后再重 1.11 更新到 1.12......…

Elasticsearch集群升级指引

目录背景第一部分版本升级指引第二部分升级方法和具体步骤总结参考文献及资料背景 Elasticsearch集群的版本升级是一项重要的集群维护工作.本篇文章参考官方文档,将详细介绍相关细节. 第一部分版本升级指引 1.1 同步升级Elastic Stack组件对于Elasticsearch的生态圈组件需要同步升级,具体配套版本可以参考官方提供的升级指南. https://www.elastic.co/cn/products/upgrade_guide 1.2 索引兼容性 Elas…

6.K8s集群升级、etcd备份和恢复、资源对象及其yaml文件使用总结、常用维护命令

1.K8s集群升级集群升级有一定的风险,需充分测试验证后实施集群升级需要停止服务,可以采用逐个节点滚动升级的方式 1.1 准备新版本二进制文件查看现在的版本 root@k8-master1:~# /usr/local/bin/kube-apiserver --version Kubernetes v1.21.0 1.1.1 从github上下载需要版本的二进制安装包,比如 1.21.5 root@k8-deploy:~/k8s-update/kubernetes-v1.21.5## ll…

vivo 万台规模 HDFS 集群升级 HDFS 3.x 实践

vivo 互联网大数据团队-Lv Jia Hadoop 3.x的第一个稳定版本在2017年底就已经发布了,有很多重大的改进. 在HDFS方面,支持了Erasure Coding.More than 2 NameNodes.Router-Based Federation.Standby NameNode Read.FairCallQueue.Intra-datanode balancer 等新特性.这些新特性在稳定性.性能.成本等多个方面带来诸多收益,我们打算将HDFS集群升级到HDFS 3.x…

Kubernetes实践技巧：集群升级k8s版本

更新证书使用 kubeadm 安装 kubernetes 集群非常方便,但是也有一个比较烦人的问题就是默认的证书有效期只有一年时间,所以需要考虑证书升级的问题,本文的演示集群版本为 v1.16.2 版本,不保证下面的操作对其他版本也适用,在操作之前一定要先对证书目录进行备份,防止操作错误进行回滚.本文主要介绍两种方式来更新集群证书. 手动更新证书由 kubeadm 生成的客户端证书默认只有一年有效期,我们可以通过 check-expiration 命令来检查证书是否过期: $ kubeadm…

Rabbitmq集群升级方案

升级Rabbitmq 3.6.3版本至3.6.6版本,升级过程中的一些关键步骤记录 Step 1: 顺序关闭集群所有节点,这里注意最后一个关闭的节点必须保证为硬盘节点,而非RAM节点: centOS 7.x+可使用systemctl工具关闭: Step 2: 备份mnesia数据库,数据库路径如下: /var/lib/rabbitmq/mnesia 其中包含该节点集群信息及持久化内容: 并将该数据库目录名变更为mnesia_xxxx(如mnesia_backup_20161213),因为新的ra…

ELK 集群升级操作

1.配置项变更 2.禁用自动分片 disabled shard allocation curl -XPUT 'localhost:9200/_cluster/settings?pretty' -H 'Content-Type: application/json' -d' { "persistent": { "cluster.routing.allocation.enable": "none" } }' 3.将内存数据同步到磁盘 curl -XP…

centos7.5环境下elasticserch5.6.15集群升级6.8.4

节点的角色分片: node01 eus_mp_web01 : master,false node,false, ingest,true node02 eus_mp_es01 : master,true node,true, ingest,true node03 eus_mp_spider01 : master,false node,true, ingest,true 背景: 生产环境大量使用 elasticsearch 集群,不同的业务使用不同版本的elasticsearch es经常曝出一些大…

redis集群升级，数据迁移及校验

本次由于安全漏洞原因,需要降redis3升级为redis6,涉及到数据迁移及校验等,用阿里redis-shake迁移工具迁移,并用阿里RedisFullCheck工具进行数据比对一.新redis安装启动开启老版本redis的哨兵模式,编辑完sentinel.conf后执行哨兵模式启动,主节点均要配置哨兵,再分别重启每个老版本redis节点 ./redis-cli -h host -p port -a password shutdown 准备redis-6.2.4.tar.gz包,放到需要安装…

Kubernetes集群升级（kubeadm升级方式）

1.升级前的版本确认(相同的大版本号下的小版本升级还是跨版本升级) 例如:从1.12.0升级到1.12.7 或者从1.12.7升级到1.13.0 2.配置kubernetes安装源(已配置kubernetes源,此处跳过) Debian/Ubuntu添加源方式: apt-get update && apt-get install -y apt-transport-https curl https://mirrors.aliyun.com/kubernetes/apt/doc/apt-ke…

使用kubeadm进行k8s集群升级

一.目标操作系统:CentOS Linux release 7.6.1810 (Core) 安装软件: docker:18.06.3-ce 从v1.15.5升级到v1.16.15 当前版本: [root@master yum.repos.d]# kubectl get node -owide NAME STATUS ROLES AGE VERSION INTERNAL-IP EXTERNAL-IP OS-IMAGE KERNEL-VERSION CONTAINER-RUNTIME master…

仅需5步，轻松升级K3s集群！

Rancher 2.4是Rancher目前最新的版本,在这一版本中你可以通过Rancher UI对K3s集群进行升级管理. K3s是一个轻量级Kubernetes发行版,借助它你可以几分钟之内设置你的开发Kubernetes环境.它非常适用于生产用例,主要用于IoT和Edge设备. 在Rancher 2.4中,你可以导入K3s集群并且可以通过Rancher本身对其进行升级管理.在本篇教程中,我们将了解如何在一个正在运行的K3s集群上执行实时升级. Step1:创建K3s集群在执行升级之前,我们…

Kubernetes 集群无损升级实践转至元数据结尾

一.背景活跃的社区和广大的用户群,使 Kubernetes 仍然保持3个月一个版本的高频发布节奏.高频的版本发布带来了更多的新功能落地和 bug 及时修复,但是线上环境业务长期运行,任何变更出错都可能带来巨大的经济损失,升级对企业来说相对吃力,紧跟社区更是几乎不可能,因此高频发布和稳定生产之间的矛盾需要容器团队去衡量和取舍. vivo 互联网团队建设大规模 Kubernetes 集群以来,部分集群较长时间一直使用 v1.10 版本,但是由于业务容器化比例越来越高,对大规模集群稳定性.应用发布的…

Centos下使用Heartbeat实现集群[转]

Linux 包括 CentOS 下高可用性（HA：High Availability）集群方案很多，而 Heartbeat 是比较常见和性价比比较高的一种。一、硬件及网络连接群集一般需要2台以上服务器，本篇以两台服务器做群集（双机热备）为例来说明。本实验在 Vmware Workstation 7.1 虚拟机中实现。两台服务器的必需配置：双网卡。其中一块网卡作为“心跳”使用。作为“心跳”的两块网卡用交叉线直接连接，作为群集的信号同步使用。多台服务器的群集，建议用全千兆交换机来连接“心跳”线…

淘宝主搜索离线集群完成Hadoop 2

淘宝搜索离线dump集群(hadoop&hbase)2013进行了几次重大升级,本文中将这些升级的详细过程.升级中所遇到的问题以及这些问题的解决方案分享给大家.至此,淘宝主搜索离线集群完全进入Hadoop 2.0时代. 搜索离线dump集群(hadoop&hbase)2013进行了几次重大升级: 2013-04 第一阶段,主要是升级hdfs为2.0版本,mapreduce仍旧是1.0;同时hbase也进行了一次重大升级(0.94.5版本),hive升级到0.9.0: 2013-09,201…

es故障节点恢复后加入集群导致删除索引重新出现

es的每个shard下的文件都可以看做一个完整的lucene文件,shard数据目录下的segment文件包含了索引的分片数量,副本数量.es shard可以恢复,就是因为每个shard都包含了一份数据,而且包含了索引的分片数量,副本数量等信息. 有这样一种情形,es集群中的某一个节点坏掉了,接着又删除了集群中的某个索引.坏掉的节点恢复后,重新加入集群,该节点上的shard还是完整的,最终的结果就是,删除的索引又被重新的恢复了.这并不是所期望的结果. es 5.x中该问题已经被解决,es会记录已…

灵雀云：etcd 集群运维实践

[编者的话]etcd 是 Kubernetes 集群的数据核心,最严重的情况是,当 etcd 出问题彻底无法恢复的时候,解决问题的办法可能只有重新搭建一个环境.因此围绕 etcd 相关的运维知识就比较重要,etcd 可以容器化部署,也可以在宿主机自行搭建,以下内容是通用的. 集群的备份和恢复添加备份 #!/bin/bash IP=123.123.123.123 BACKUP_DIR=/alauda/etcd_bak/ mkdir -p $BACKUP_DIR export ETCDCTL_AP…

HDFS集群数据不均衡处理

一.概述公司使用是自己搭建的hadoop集群,版本2.7.3,最近发现出现了hdfs数据存储不均衡的现象,其中有一个datanode使用了65%,而有一个只使用了20%.hadoop集群使用的时间长了会出现这种数据不均衡的问题,当然hadoop提供了解决方案,就是使用balancer,默认进行的是datanode级别的数据均衡,但是2.X版本还不支持datanode内的磁盘之间数据均衡,hadoop在3.0以后的版本里面提供了相关的支持,参考https://hadoop.apache.org/…

redis介绍（8） window 下redis的集群（cluster命令）

前言: 前段时间我在centos上搭建过一次redis集群,那是借助ruby搭建,这次我介绍一种纯redis集群命令的方式去搭建[最后我会简单介绍ruby搭建]. redis集群搭建(三主三备): 准备工作: 第一步:下载redis 在这我用的是第二步:创建一个集群存放的目录 redis-cluster .把下载好的redis cp进去,然后修改配置文件. 注意:windox版本的redis的配置文件是 redis.windows-service.conf,下面我来进行改造一下,把每…

etcd 集群运维实践

etcd 是 Kubernetes 集群的数据核心,最严重的情况是,当 etcd 出问题彻底无法恢复的时候,解决问题的办法可能只有重新搭建一个环境.因此围绕 etcd 相关的运维知识就比较重要,etcd 可以容器化部署,也可以在宿主机自行搭建,以下内容是通用的. 集群的备份和恢复添加备份 #!/bin/bash IP=123.123.123.123 BACKUP_DIR=/alauda/etcd_bak/ mkdir -p $BACKUP_DIR export ETCDCTL_API=3 et…

离线安装 Rancher2.2.4 HA 集群

一.先决条件(所有主机执行) 1.1 基础设置 1.安装基础软件 yum install -y vim net-tools wget lrzsz 2.防火墙 sed -i 's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config setenforce systemctl stop firewalld.service && systemctl disable firewalld.service 3.时间同步 yum instal…

在 Web 级集群中动态调整 Pod 资源限制

作者阿里云容器平台技术专家王程阿里云容器平台技术专家张晓宇(衷源) ## 引子不知道大家有没有过这样的经历,当我们拥有了一套 Kubernetes 集群,然后开始部署应用的时候,我们应该给容器分配多少资源呢?很难说.由于 Kubernetes 自己的机制,我们可以理解容器的资源实质上是一个静态的配置.如果我发发现资源不足,为了分配给容器更多资源,我们需要重建 Pod.如果分配冗余的资源,那么我们的 worker node 节点似乎又部署不了多少容器.试问,我们能做到容器资源的按需分配吗?这…

当 K8s 集群达到万级规模，阿里巴巴如何解决系统各组件性能问题？

作者 | 阿里云容器平台高级技术专家曾凡松(逐灵) 本文主要介绍阿里巴巴在大规模生产环境中落地 Kubernetes 的过程中,在集群规模上遇到的典型问题以及对应的解决方案,内容包含对 etcd.kube-apiserver.kube-controller 的若干性能及稳定性增强,这些关键的增强是阿里巴巴内部上万节点的 Kubernetes 集群能够平稳支撑 2019 年天猫 618 大促的关键所在. 背景从阿里巴巴最早期的 AI 系统(2013)开始,集群管理系统经历了多轮的架构演进,到…

使用 Sealos 在 3 分钟内快速部署一个生产级别的 Kubernetes 高可用集群

本文首发于:微信公众号「运维之美」,公众号 ID:Hi-Linux. 「运维之美」是一个有情怀.有态度,专注于 Linux 运维相关技术文章分享的公众号.公众号致力于为广大运维工作者分享各类技术文章和发布最前沿的科技信息.公众号的核心理念是:分享,我们认为只有分享才能使我们的团体更强大.如果你想第一时间获取最新技术文章,欢迎关注我们! 公众号作者 Mike,一个月薪 3000 的杂工.从事 IT 相关工作 15+ 年,热衷于互联网技术领域,认同开源文化,对运维相关技术有自己独特的见解.很愿意将自…

Kubernetes 使用 ingress 配置 https 集群(十五)

目录一.背景 1.1 需求 1.2 Ingress 1.3 环境介绍二.安装部署 2.1.创建后端 Pod 应用 2.2 创建后端 Pod Service 2.3.创建 ingress 资源 2.4.为 Nginx Pod 创建 Service 三.升级为 https 3.1 首先我们要制作证书 3.2.创建 secret 资源 3.3 更改 ingress 资源 3.4 浏览器访问验证四.ingress 资源介绍 4.1.通过访问路径过滤 4.2.基于名称解析的虚拟主机 4.3.http…

[转帖]当 K8s 集群达到万级规模，阿里巴巴如何解决系统各组件性能问题？

改天学习一下. https://www.cnblogs.com/alisystemsoftware/p/11570806.html 当 K8s 集群达到万级规模,阿里巴巴如何解决系统各组件性能问题? 作者 | 阿里云容器平台高级技术专家曾凡松(逐灵) 本文主要介绍阿里巴巴在大规模生产环境中落地 Kubernetes 的过程中,在集群规模上遇到的典型问题以及对应的解决方案,内容包含对 etcd.kube-apiserver.kube-controller 的若干性能及稳定性增强,这些关键…

【kuberadm集群升级】的更多相关文章