kuberbetes部署和启动正常,但是kube-dns持续重启

使用命令

kubectl get pods --all-namespaces

得到结果

从图中可以看出kube-dns-c7d85897f-jmntw 在不断重启

使用命令

 kubectl describe pod kube-dns-c7d85897f-jmntw -n kube-system

得到结果

Name:           kube-dns-c7d85897f-jmntw
Namespace: kube-system
Node: 172.18.196.2/172.18.196.2
Start Time: Tue, Jun :: +
Labels: k8s-app=kube-dns
pod-template-hash=
Annotations: scheduler.alpha.kubernetes.io/critical-pod=
Status: Running
IP: 172.20.1.9
Controlled By: ReplicaSet/kube-dns-c7d85897f
Containers:
kubedns:
Container ID: docker://516c137ece876a83fc16d26a4fb2c526d8daa75423d1f2371b0b2142bfd2e00a
Image: mirrorgooglecontainers/k8s-dns-kube-dns-amd64:1.14.
Image ID: docker-pullable://mirrorgooglecontainers/k8s-dns-kube-dns-amd64@sha256:956ac5f14a388ab9887ae07f36e770852f3f51dcac9e0d193ce8f62cbf066b13
Ports: /UDP, /TCP, /TCP
Args:
--domain=cluster.local.
--dns-port=
--config-dir=/kube-dns-config
--v=
State: Running
Started: Tue, Jun :: +
Ready: True
Restart Count:
Limits:
memory: 170Mi
Requests:
cpu: 100m
memory: 70Mi
Liveness: http-get http://:10054/healthcheck/kubedns delay=60s timeout=5s period=10s #success=1 #failure=5
Readiness: http-get http://:8081/readiness delay=3s timeout=5s period=10s #success=1 #failure=3
Environment:
PROMETHEUS_PORT:
Mounts:
/kube-dns-config from kube-dns-config (rw)
/var/run/secrets/kubernetes.io/serviceaccount from kube-dns-token-2ndrd (ro)
dnsmasq:
Container ID: docker://5871fe23f088d23dd342fa7a891be0b5b9f3f879a0902e6633baaa418b2a920f
Image: mirrorgooglecontainers/k8s-dns-dnsmasq-nanny-amd64:1.14.
Image ID: docker-pullable://mirrorgooglecontainers/k8s-dns-dnsmasq-nanny-amd64@sha256:38f69fab59a32a490c8c62b035f6aa8dbf9a320686537225adaee16a07856d17
Ports: /UDP, /TCP
Args:
-v=
-logtostderr
-configDir=/etc/k8s/dns/dnsmasq-nanny
-restartDnsmasq=true
--
-k
--cache-size=
--log-facility=-
--server=/cluster.local./127.0.0.1#
--server=/in-addr.arpa/127.0.0.1#
--server=/ip6.arpa/127.0.0.1#
State: Running
Started: Tue, Jun :: +
Last State: Terminated
Reason: Error
Exit Code:
Started: Tue, Jun :: +
Finished: Tue, Jun :: +
Ready: True
Restart Count:
Requests:
cpu: 150m
memory: 20Mi
Liveness: http-get http://:10054/healthcheck/dnsmasq delay=60s timeout=5s period=10s #success=1 #failure=5
Environment: <none>
Mounts:
/etc/k8s/dns/dnsmasq-nanny from kube-dns-config (rw)
/var/run/secrets/kubernetes.io/serviceaccount from kube-dns-token-2ndrd (ro)
sidecar:
Container ID: docker://bffdb2ace942a0608c2a35e34098d0b43519cce8778371fd96ac549300bf9897
Image: mirrorgooglecontainers/k8s-dns-sidecar-amd64:1.14.
Image ID: docker-pullable://mirrorgooglecontainers/k8s-dns-sidecar-amd64@sha256:7caad6678b148c0c74f8b84efa93ddde84e742fa37b25d20ecfdbd43fba74360
Port: /TCP
Args:
--v=
--logtostderr
--probe=kubedns,127.0.0.1:,kubernetes.default.svc.cluster.local.,,A
--probe=dnsmasq,127.0.0.1:,kubernetes.default.svc.cluster.local.,,A
State: Running
Started: Tue, Jun :: +
Last State: Terminated
Reason: Error
Exit Code:
Started: Tue, Jun :: +
Finished: Tue, Jun :: +
Ready: True
Restart Count:
Requests:
cpu: 10m
memory: 20Mi
Liveness: http-get http://:10054/metrics delay=60s timeout=5s period=10s #success=1 #failure=5
Environment: <none>
Mounts:
/var/run/secrets/kubernetes.io/serviceaccount from kube-dns-token-2ndrd (ro)
Conditions:
Type Status
Initialized True
Ready True
PodScheduled True
Volumes:
kube-dns-config:
Type: ConfigMap (a volume populated by a ConfigMap)
Name: kube-dns
Optional: true
kube-dns-token-2ndrd:
Type: Secret (a volume populated by a Secret)
SecretName: kube-dns-token-2ndrd
Optional: false
QoS Class: Burstable
Node-Selectors: <none>
Tolerations: CriticalAddonsOnly
Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Warning Unhealthy 8m (x41 over 1h) kubelet, 172.18.196.2 Liveness probe failed: HTTP probe failed with statuscode:
Warning Unhealthy 7m (x15 over 1h) kubelet, 172.18.196.2 Liveness probe failed: Get http://172.20.1.9:10054/healthcheck/kubedns: dial tcp 172.20.1.9:10054: getsockopt: connection refused

这里有两个warning ,不知道什么原因

使用命令

kubectl logs -n kube-system kube-dns-c7d85897f-jmntw -c dnsmasq

得到结果

I0605 ::08.863881        main.go:] opts: {{/usr/sbin/dnsmasq [-k --cache-size= --log-facility=- --server=/cluster.local./127.0.0.1# --server=/in-addr.arpa/127.0.0.1# --server=/ip6.arpa/127.0.0.1#] true} /etc/k8s/dns/dnsmasq-nanny }
I0605 ::08.863997 nanny.go:] Starting dnsmasq [-k --cache-size= --log-facility=- --server=/cluster.local./127.0.0.1# --server=/in-addr.arpa/127.0.0.1# --server=/ip6.arpa/127.0.0.1#]
I0605 ::09.049758 nanny.go:]
W0605 ::09.049779 nanny.go:] Got EOF from stdout
I0605 ::09.049789 nanny.go:] dnsmasq[]: started, version 2.78 cachesize
I0605 ::09.049795 nanny.go:] dnsmasq[]: compile time options: IPv6 GNU-getopt no-DBus no-i18n no-IDN DHCP DHCPv6 no-Lua TFTP no-conntrack ipset auth no-DNSSEC loop-detect inotify
I0605 ::09.049800 nanny.go:] dnsmasq[]: using nameserver 127.0.0.1# for domain ip6.arpa
I0605 ::09.049803 nanny.go:] dnsmasq[]: using nameserver 127.0.0.1# for domain in-addr.arpa
I0605 ::09.049807 nanny.go:] dnsmasq[]: using nameserver 127.0.0.1# for domain cluster.local
I0605 ::09.049811 nanny.go:] dnsmasq[]: reading /etc/resolv.conf
I0605 ::09.049815 nanny.go:] dnsmasq[]: using nameserver 127.0.0.1# for domain ip6.arpa
I0605 ::09.049819 nanny.go:] dnsmasq[]: using nameserver 127.0.0.1# for domain in-addr.arpa
I0605 ::09.049823 nanny.go:] dnsmasq[]: using nameserver 127.0.0.1# for domain cluster.local
I0605 ::09.049827 nanny.go:] dnsmasq[]: using nameserver 127.0.1.1#
I0605 ::09.049836 nanny.go:] dnsmasq[]: read /etc/hosts - addresses
I0605 ::50.451300 nanny.go:] dnsmasq[]: Maximum number of concurrent DNS queries reached (max: )
I0605 ::00.464414 nanny.go:] dnsmasq[]: Maximum number of concurrent DNS queries reached (max: )

从这里可以看出nameserver是少了个节点上的nameserver

其实这里是因为忘了改node节点上的nameserver

修改 /etc/resolv.conf的nameserver

aaarticlea/png;base64," alt="" />

改成学校的域名服务器,注意每一个node上都要改,因为不知道dns服务会部署在哪个node上

然后再重启kubedns的服务

kubectl delete pod -n kube-system kube-dns-69bf9d5cc9-c68mw

看到nameserver用了10.8.8.8就可以了

但是通常集群都有好多个节点,一个一个节点修改太慢了,下面再补充一个利用ansible 修改集群所有节点的nameserver

root@ht-:/etc/ansible# ansible all -m lineinfile -a "dest=/etc/resolv.conf regexp='nameserver 127.0.1.1' line='nameserver 10.8.8.8'"

【Kubernetes】kube-dns 持续重启的更多相关文章

  1. 构建gitlab+Jenkins+harbor+kubernetes的DevOps持续集成持续部署环境

    构建gitlab+Jenkins+harbor+kubernetes的DevOps持续集成持续部署环境 整个环境的结构图. 一.准备工作 gitlab和harbor我是安装在kubernetes集群外 ...

  2. [linux]解决DNS配置重启丢失

    DNS配置重启丢失 每次重启后都修改DNS配置文件 /etc/resolv.conf从网上得知 /etc/resolv.conf中的DNS配置是从/etc/resolvconf/resolv.conf ...

  3. Docker+GitLab+Jenkins+kubernetes实现DevOps 持续化集成和持续化部署概念图

    Docker+GitLab+Jenkins+kubernetes实现DevOps 持续化集成和持续化部署概念图 转载自:原创 IT综合 作者:百联达 时间:2017-05-09 15:48:08 41 ...

  4. Cent0S 6.7直接在/etc/resolv.conf文件下修改DNS地址重启不生效问题【转】

    CentOS 6.7/Linux下设置IP地址 1:临时修改: 1.1:修改IP地址 # ifconfig eth0 192.168.2.104 1.2:修改网关地址 # route add defa ...

  5. Jenkins+GitLab+Docker+SpringCloud+Kubernetes实现可持续自动化微服务

    现有混合云平台的场景下,即有线下和线上的环境,又有测试与正式的场景,而且结合了Docker,导致打包内容有所区分,且服务的发布流程复杂起来,手工打包需要在编译阶段就要根据环境到处更改配置,因此纯手工发 ...

  6. Kubernetes部署DNS

    前言 阅读地址 http://thoreauz.com/2017/04/16/docker/Kubernetes%E9%83%A8%E7%BD%B2DNS%E5%92%8CDashboard/ Kub ...

  7. liunx之:解决liunx下dns配置重启失效的问题

    有时候能ping同ip地址,却ping不通域名,这就是dns没有配置的缘故. 但是DNS配置文件 /etc/resolv.conf 每次重启就会失效. 打开这个配置文件,发现有注释提示: Dynami ...

  8. CentOS DNS resolv重启无效的解决方法

    分类: LINUX 直接修改/etc/resolv.conf不行.必须要在/etc/sysconfig/network-scripts/ifcfg-eth0里面最后 加上dns的设置.要不然,重启后, ...

  9. k8s集群之上游dns--dnsmasq,统一管理kubernetes的dns解析

    1.概述 首先部署好kubernetes集群并采用Coredns进行解析,这样集群内部的服务都能通过内部域名进行访问.但是集群内部的coredns与物理机的dns解析不完全统一,coredns不能解析 ...

随机推荐

  1. python_13(前端—cs)

    第1章 前端三大标准:1.1 三大标准介绍 1.2 html标签一览表 第2章 结构标准 html 2.1 html结构 2.2 html常用标签 2.2.1 h1-h6 2.2.2 span 2.2 ...

  2. ubuntu 16.0.4安装MySQL5.7

    系统版本 root@sishen:~# uname -a Linux sishen 4.10.0-35-generic #39~16.04.1-Ubuntu SMP Wed Sep 13 09:02: ...

  3. 动手实现 Redux(二):抽离 store 和监控数据变化

    上一节 的我们有了 appState 和 dispatch: let appState = { title: { text: 'React.js 小书', color: 'red', }, conte ...

  4. P1116 车厢重组

    题目描述 在一个旧式的火车站旁边有一座桥,其桥面可以绕河中心的桥墩水平旋转.一个车站的职工发现桥的长度最多能容纳两节车厢,如果将桥旋转180度,则可以把相邻两节车厢的位置交换,用这种方法可以重新排列车 ...

  5. css 尺寸、边框、内边距、背景以及css Sprite

    上节课回顾: HTML标签: 格式排版 p 段落 双br 换行 单hr 分隔线 单h1~h6 标题 双pre 原样格式化输出 双div 标签,无任何特殊意义 HTML标签 :文本 <em> ...

  6. 正确使用MySQL JDBC setFetchSize()方法解决JDBC处理大结果

    一直很纠结,Oracle的快速返回机制,虽然结果集很多,可是它能很快的显示第一个结果,虽然通过MYSQl的客户端可以做到,但是通过JDBC却不行. 今天用了1个多小时,终于搞定此问题,希望对广大Jav ...

  7. vue-cli下面的config/index.js注解 webpack.base.conf.js注解

    config/indexjs详解上代码: 'use strict' // Template version: 1.3.1 // see http://vuejs-templates.github.io ...

  8. Zotero文献管理神器使用

    为什么使用Zotero管理论文? 1.可以从网上剪藏 2.可以查询 3.有作者 标题 期刊 索引 4.word自动生成论文索引 把pdf文件导入Zotero 按住ctrl+shift拖动pdf文件,就 ...

  9. Android(java)学习笔记172:服务(service)之绑定服务调用服务里面的方法 (采用接口隐藏代码内部实现)

    1. 接口 接口可以隐藏代码内部的细节,只暴露程序员想暴露的方法 2. 利用上面的思想优化之前的案例:服务(service)之绑定服务调用服务里面的方法,如下: (1)这里MainActivity.j ...

  10. Python3简明教程(九)—— 文件处理

    文件是保存在计算机存储设备上的一些信息或数据.你已经知道了一些不同的文件类型,比如你的音乐文件,视频文件,文本文件.Linux 有一个思想是“一切皆文件”,这在实验最后的 lscpu 的实现中得到了体 ...