安装pre-flight

  master机器会安装上安装文件(同时check条件是否满足要求),其他的agent设备只是check各种条件是否具备。

  确保53/2181端口没有被占用;centos7每次启动机器都会启动dnsmasq服务(占用53端口),坑爹的是服务已经被disable,还是会被启动,估计是在rc.local里面做的。

deploy流程

  实时监控(包括定位问题):
 journalctl -xe -fu dcos-setup.service --no-pager

  需要detect脚本的py是这个,要读源码的看这:
  /opt/mesosphere/packages/exhibitor--5ecf040aa74a1c1f29ab543b4d5a23a738975c5f/usr/exhibitor/start_exhibitor.py

  NTP惹的祸

  Master之前的dcos-navstar.service服务异常,只是因为NTP服务没有启动;导致了部署失败;使得master节点以及一个agent节点,就是因为NTP没有启动,而挂在那里了。

操作

  成功后的联网问题

  部署成功后,可能将会要求你使用github,google,microsoft账号登录,但是登录之后爆出异常:
  Unable to login to your DC/OS cluster. Clusters must be connected to the internet.
  如果不想要认证,可以在安装的时候,不要勾选aunthentication选项(GUI安装页面的底部);或者是安装的配置文件中添加一句:
   oauth_enabled: false

  推测应该是只有企业版本才可以通过认证的方式来进行操作。

  记得关闭防火墙

  进入到了管理页面之后,发现一个节点总是连接不上,重启了dcos-spartan.service服务之后,发现重新注册,但是仍然是连接不上状态;后来发现原来这个节点的firewalld服务是打开的。

  扩展节点
  官网介绍地址:https://dcos.io/docs/1.10/administering-clusters/add-a-node/

  1.打包扩展安装包(其实就是把install以及配置文件打包)

   cd genconf/serve
  sudo tar cf dcos-install.tar *

  2. 在扩展节点上的准备工作

 sudo mkdir -p /opt/dcos_install_tmp
sudo tar xf dcos-install.tar -C /opt/dcos_install_tmp

  3. 启动
  private slave节点

sudo bash /opt/dcos_install_tmp/dcos_install.sh slave

  public slave节点
 sudo bash /opt/dcos_install_tmp/dcos_install.sh slave_public

调试

  日志排查

  定位问题,就是journalctl -fu XXX,XXX来自于systemctl | grep dcos,逐个排查。

  master部署后,频繁的看到下面的日志,期初以为是什么服务挂了,老重启,后来调查才发现:这是正常的是exhibitor周期性发送的连接,可以调周期(但是不知道在哪里调)。

  Accepted socket connection from /127.0.0.1:58444
  Processing srvr command from /127.0.0.1:58444
  [Thread-520:NIOServerCnxn@1044] - Closed socket connection for client /127.0.0.1:51144 (no session established for client)

重启

  重启dcos-mesos-slave-public/dcos-mesos-slave服务,遇到下面的问题,八成就是因为detect_ip脚本返回的不正确;
  ping: ready.spartan: Name or service not known
  

DCOS安装的更多相关文章

  1. DCOS(centos 7.4/7.6)

    https://dcos.io/releases/ https://downloads.dcos.io/dcos/stable/1.12.0/dcos_generate_config.sh https ...

  2. 原创docker dcos 的安装

    原创哈,上个星期无意间发现了一个可以好东西 DC/OS https://dcos.io 这个是官网哈 然后就痛苦的折磨了一个多星期; 基本是参照到https://dcos.io/docs/1.7/ad ...

  3. 安装DCOS,关于docker异常引发的调查

    入门DCOS,刚开始安装,碰到了一个异常: Bind for 0.0.0.0:9000 failed: port is already allocated. 调试这个问题花费了好长时间,因为无法通过n ...

  4. 使用ARM模板在Azure中国大规模部署DCOS集群

    容器技术是目前非常流行的技术,尤其是在以Docker作为容器引擎的推动下,让容器的轻量级,可移植,自包含,隔离性等的上了一个新的台阶,目前谈及Dev/Ops,CI/CD很少能够绕过Docker的. A ...

  5. linux ubuntu下如何安装并且切换java版本(Unsupported major.minor version 52.0)

    最近在做一个dcos(数据中心操作系统)的东西,需要用marathon来做进程管理.遗憾的是0.6版本的marathon在API方面很是缺少,换成了0.15版本之后,运行时提示“Unsupported ...

  6. 【 DCOS 】织云 CMDB 管理引擎技术详解

    欢迎大家前往腾讯云技术社区,获取更多腾讯海量技术实践干货哦~ 作者 : 李琦 , 腾讯高级工程师 , 就职于网络平台部.曾负责公司海量运营系统的规划设计,如 TMP.Sniper.GSLB.IDCSp ...

  7. DCOS实践分享(4):如何基于DC/OS整合SMACK(Spark, Mesos, Akka, Cassandra, Kafka)

    这篇文章入选CSDN极客头条 http://geek.csdn.net/news/detail/71572 当前,要保证业务的市场竞争力,仅靠设计一个可用并且好看的产品,已经完全不能满足要求.全球消费 ...

  8. DC/OS安装

    dc/os: https://dcos.io/ 安装文档-docker:https://docs.mesosphere.com/1.11/installing/oss/custom/system-re ...

  9. DCOS :私有云的物理基础架构管理引擎

    https://cloud.tencent.com/developer/article/1005598 一.引言 云计算经过多年的发展,逐渐从概念到渐为人认知.到接受.到现在全行业拥抱上云,云的客户也 ...

随机推荐

  1. 【HackerRank】Median

    题目链接:Median 做了整整一天T_T 尝试了各种方法: 首先看了解答,可以用multiset,但是发现java不支持: 然后想起来用堆,这个基本思想其实很巧妙的,就是维护一个最大堆和最小堆,最大 ...

  2. Linux环境下的图形系统和AMD R600显卡编程(2)——Framebuffer、DRM、EXA和Mesa简介

    转:https://www.cnblogs.com/shoemaker/p/linux_graphics02.html 1. Framebuffer Framebuffer驱动提供基本的显示,fram ...

  3. bootstrap 模态框中弹出层 input不能获得焦点且不可编辑

    bootstrap 模态框中弹出层 input不能获得焦点且不可编辑 问题描述:bs框架支持一层model层的情况下,在模态框中弹出了自定义的弹出层.发现自定义弹出层的输入框不能获得焦点且不可编辑. ...

  4. 去duplicate的方法

    1.什么是duplicate,为什么要去除. 什么是duplicate:这是在建库的过程后,对已连有接头的DNA片段进行扩增,然后去接flowcell.之所以在建库后扩增,这是由于接flowcell的 ...

  5. jsp 内置对象---EL

    ServletRequest : java.lang.String      getParameter(java.lang.String name) 返回一个string           对应 n ...

  6. CodeForces 266E More Queries to Array...(线段树+式子展开)

    开始觉得是规律题的,自以为是的推了一个规律,结果测试数据都没过....看了love神的博客才发现只是把式子展开就找到规律了.不过挺6的是我虽然想错了,但是维护的的东西没有错,只是改改(改了进两个小时好 ...

  7. matlab学习笔记,图像分块

    clc; clear all; close all; I = imread('E:\matlab\files-images\tomsen512.jpg'); rs = size(I, 1);% 行数c ...

  8. 实例说明Java中的null(转)

    让我们先来看下面的语句: String x = null; 1. 这个语句到底做了些什么?  让我们回顾一下什么是变量,什么是变量值.一个常见的比喻是 变量相当于一个盒子.如同可以使用盒子来储存物品一 ...

  9. CEF3.2623使用记录:windows编译

    CEF3.2623使用记录:windows编译 1:cef3.2623下载地址 2623是cef3最后一个支持xp系统的版本,且可以支持html的audio标签,可以用作对html音频的处理下载地址为 ...

  10. 项目开发之git配置

    1.本地安装git配置 安装步骤,这里不详细介绍,软件下载然后安装即可. 查看git安装版本 #git --version 2.git密钥生成 ssh-keygen -t rsa -C "f ...