国内不fq安装K8S一: 安装docker

国内不fq安装K8S二: 安装kubernet

国内不fq安装K8S三: 使用helm安装kubernet-dashboard

国内不fq安装K8S四: 安装过程中遇到的问题和解决方法

4 安装过程中遇到的问题和解决方法

4.1 常见问题

(1) Kubernetes Pod错误ErrImagePull?

两种办法:

1 直接docker pull gcr.azk8s.cn/XXX,然后tag成gcr.io/XXX或其他的即可解决。

2 编辑pod的配置

kubectl edit deployment tiller-deploy -n kube-system

找到相应的源地址,如"gcr.io/kubernetes-helm/tiller"替换成亚马逊的地址"gcr.azk8s.cn/kubernetes-helm/tiller"即可

(2) kube-proxy有一个成功开启了ipvs另一个没有成功开启ipvs

有可能是有一个节点的下面这条命令没执行好

$ cat > /etc/sysconfig/modules/ipvs.modules <<EOF
#!/bin/bash
modprobe -- ip_vs
modprobe -- ip_vs_rr
modprobe -- ip_vs_wrr
modprobe -- ip_vs_sh
modprobe -- nf_conntrack_ipv4
EOF
chmod 755 /etc/sysconfig/modules/ipvs.modules && bash /etc/sysconfig/modules/ipvs.modules && lsmod | grep -e ip_vs -e nf_conntrack_ipv4

(3) 节点上要运行其他程序,不能关闭swap

修改kubernet的配置是一样的:

在/etc/sysctl.d/k8s.conf后添加

vm.swappiness=0

使生效

sysctl -p /etc/sysctl.d/k8s.conf

修改/etc/sysconfig/kubelet加入

KUBELET_EXTRA_ARGS=--fail-swap-on=false

(4)node上多网卡导致的报错

"E0110 23:48:52.242726 1 main.go:127] Failed to create SubnetManager: error retrieving pod spec for 'kube-system/kube-flannel-ds-xbbqs': Get https://10.96.0.1:443/api/v1/namespaces/kube-system/pods/kube-flannel-ds-xbbqs: dial tcp 10.96.0.1:443: i/o timeout"

修改kube-flannel.yml添加"--iface=ens32"一句指定网卡

......
containers:
- name: kube-flannel
image: quay.io/coreos/flannel:v0.11.0-amd64
command:
- /opt/bin/flanneld
args:
- --ip-masq
- --kube-subnet-mgr
- --iface=ens32
......

详见:flannel issues 39701: https://github.com/kubernetes/kubernetes/issues/39701

(5)helm报,各种 "TILLER: dial tcp 10.96.0.1:443: i/o timeout"

有可能是多个问题导致的这个错误,我的错误是docker-ce19.03.1不再kubernet的支持列表中导致的。因此我更换了docker版本解决的。

如果是其他问题,可以通过执行"kubectl logs XXX -n XXnamespaceXX"和"kubectl describe pod XXXXX -n XXX"定位

(6)kubelet启动的时提示masked

systemctl unmask kubelet.service

(7)token忘了或者过期

解决办法如下:

https://blog.csdn.net/weixin_44208042/article/details/90676155

4.2 常用的操作命令

查看所有pod的信息:

kubectl get pod --all-namespaces -o wide

查看system的pod

kubectl get pod -n kube-system

查看一个pod的错误信息

kubectl describe pod coredns-5c98db65d4-djt9j --namespace=kube-system

删除一个pod(其实普通的删除等于重启)

kubectl delete po <your-pod-name> -n <name-space> --force --grace-period=0
kubectl delete po tiller-deploy-7bf78cdbf7-cr5mj -n kube-system --force --grace-period=0

修改部pod的配置:

``bash

kubectl edit deployment tiller-deploy -n kube-system

查看日志:
```bash
kubectl logs -f coredns-5c98db65d4-mp6vg -n kube-system

查看所有节点:

kubectl get nodes

tty到一个已经运行的pod中

kubectl attach curl-6bf6db5c4f-btwbm -it

带label查看节点:

kubectl get nodes --show-labels

给节点打label

kubectl label node kub1 node-role.kubernetes.io/edge=

4.3 比较好的博客

青蛙小白:https://blog.frognew.com/2019/07/kubeadm-install-kubernetes-1.15.html

掘金:https://juejin.im/post/5cb7dde9f265da034d2a0dba

安装Kubernetes节点: https://www.cnblogs.com/xieyifeng/p/9383236.html

helm dashboard: https://mp.weixin.qq.com/s/S9OvZa7oW7qo_9m4OznVtA

k8s基础知识: https://www.jianshu.com/p/95c2bc74e2b2?utm_source=oschina-app

官网:https://yeasy.gitbooks.io/docker_practice/content/opensource/

亚马逊集成环境:https://github.com/Azure/container-service-for-azure-china

国内不fq安装K8S四: 安装过程中遇到的问题和解决方法的更多相关文章

  1. 将html代码部署到阿里云服务器,并进行域名解析,以及在部署过程中遇到的问题和解决方法

    本博客主要是说一下,,如何将html代码部署到阿里云服务器,并进行域名解析,以及在部署过程中遇到的问题和解决方法. 1.先在阿里云上购买一台阿里云服务器(ECS云服务器): 2.远程连接上该服务器,在 ...

  2. 2016最新cocoapods安装流程,安装过程中遇到的问题及解决方法

    现在的cocoapods与之前比较.有很多不一样的地方.自己试了一试,终于搞定.现在大概纪录一下. 1.首先查看ruby是否是最新版的. ruby是通过rvm安装的所以需要先安装rvm后查看ruby是 ...

  3. 最新cocoapods安装流程,安装过程中遇到的问题及解决方法

    最近重新安装了一次cocoapods,参考的安装流程:http://blog.csdn.net/showhilllee/article/details/38398119/ 但是现在的cocoapods ...

  4. caffe安装过程中遇到的问题以及解决方法

    1. 在安装依赖库的时候,遇到: @gxjun-Latitude-E5440:~$ sudo apt-get install libatlas-base-dev 正在读取软件包列表... 完成 正在分 ...

  5. Tomcat启动过程中找不到JAVA_HOME解决方法

    在XP上明明已经安装了JDK1.5并设置好了JAVA_HOME,可偏偏Tomcat在启动过程中找不到. 报错信息如下:Neither the JAVA_HOME nor the JRE_HOME en ...

  6. InstallShield 工程类型MSI 使用过程中碰到的问题及解决方法。

    原文 http://www.cnblogs.com/daocaorenbx/p/InstallShield.html 一.安装完 桌面创建IE快捷方式: 1.  install script可以直接建 ...

  7. live555源码研究(十)------在编译过程中遇到的问题及解决方法

    一.编译testOnDemandRTSPServer.cpp. 在testProgs项目中,加入testOnDemandRTSPServer.cpp进行编译,编译类型是编译成exe文件,在编译过程中会 ...

  8. Hadoop环境搭建过程中遇到的问题以及解决方法

    1.启动hadoop之前,ssh免密登录slave主机正常,使用命令start-all.sh启动hadoop时,需要输入slave主机的密码,说明ssh文件权限有问题,需要执行以下操作: 1)进入.s ...

  9. 使用rabbitmq过程中遇到的问题及解决方法记录。

    OS: Linux ---Centos7RabbitMQ版本:RabbitMQ version: 3.8.1erlang版本:Erlang configuration: Erlang/OTP 22 [ ...

随机推荐

  1. Spring Boot中以代码方式配置Tomcat

    在Spring Boot2.0以上配置嵌入式Servlet容器时EmbeddedServletContainerCustomizer类不存在,经网络查询发现被WebServerFactoryCusto ...

  2. 使用hangfire在xunit中

    框架为:abp hangfire配置连接:https://aspnetboilerplate.com/Pages/Documents/Hangfire-Integration 在单元测试中如何配置呢? ...

  3. JS闭包—你不知道的JavaScript上卷读书笔记(二)

    关于闭包,初学者会被绕的晕头转向,在学习的路上也付出了很多精力来理解. 让我们一起来揭开闭包神秘的面纱. 闭包晦涩的定义 看过很多关于闭包的定义,很多讲的云里雾里,晦涩难懂.让不少人以为闭包是多么玄乎 ...

  4. PKUSC2018题解

    PKUSC2018题解 真实排名 分别考虑第\(i\)个人翻倍和不翻倍的情况,组合数算一下即可,务必注意实现细节. 代码 最大前缀和 设\(sum_s\)表示集合\(\sum_{i\in s} a_i ...

  5. c++的CreateFile导致内存不能为written错误

    LPCWSTR szFileName; szFileName=argv[2]; //LPCWSTR szFileName=L"test.txt";//文件名字可以根据自己的需要修改 ...

  6. [LeetCode] 179. Largest Number 最大组合数

    Given a list of non negative integers, arrange them such that they form the largest number. Example ...

  7. Asp.Net Core 减少Controller获取重复注入对象

    原文:Asp.Net Core 减少Controller获取重复注入对象 版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/u012770274/art ...

  8. uwsgi异常服务器内存cpu爆满

    记录线上服务器通过linux性能检测工具glances检测到 cpu.内存爆满,且是uwsgi进程占用,对于服务器内核,以及uwsgi配置优化 参考文章 https://blog.csdn.net/o ...

  9. Elasticsearch由浅入深(十一)内核原理

    倒排索引组成结构以及索引不可变原因 对于倒排索引是非常适合用来进行搜索的它的结构:(1)包含这个关键词的document list(2)包含这个关键词的所有document的数量:IDF(invers ...

  10. 在Azure DevOps Server (TFS)中实现VUE项目的自动打包

    概述 Vue.js(读音 /vjuː/, 类似于 view)是一个构建数据驱动的 web 界面的渐进式框架.由于它在数据绑定.页面展示和使用简单方面有很大的优势,逐渐被越来越多的前端开发团队使用.本文 ...