Doris再次启动FE失败的思考

背景描述

在昨天已经成功下载安装最新稳定版docker、拉取doris-0.15.0版本的镜像、将镜像挂载道本地Doris源码目录、完成了doris的编译之后,今天在继续按照文档进行集群部署时,基本没遇到什么问题,后面在查看be节点状态时发现hadoop102节点的可用空间只有3个G,便想给hadoop102集群扩容

问题描述

直接关掉虚拟机后,删除所有快照(不删不让在VMvare的设置里面修改虚拟机的空间),然后将空间从50G改到了80G--(后来才知道在设置里面扩展的是虚拟磁盘空间)--,重启时出现的一个问题也都解决了,但是hadoop102节点的状态发生了改变,回退了很多操作,导致我需要重新给他配置并启动doris,我从其他节点直接拷贝配置文件过来,然后运行fe报错,运行其他节点的fe也会报错

问题原因

Centos7磁盘空间扩容操作不规范,删掉所有快照,回退了操作,导致集群出现故障

Centos7磁盘空间扩容

报错信息

一、FE启动失败,fe.log 中一直滚动如下信息:

wait catalog to be ready. FE type UNKNOWN

听说是因为doris暂时不支持ip变动,因为fe主节点ip变化 导致无法启动,换个版本重新编译一遍,再部署一次就好了

二、尝试使用Mysql客户端连接Doris时报错

Lost connection to MySQL server at 'reading initial communication packet', system error: 0

通常是因为编译 FE 时使用的 jdk 版本和运行 FE 时使用的 jdk 版本不同导致的。



三、启动FE时,使用jps命令看不到进程,查看日志

java.lang.Suchmethoderror: java.nio. ByteBuffer. limit (I)Ljava/nio/ByteBuffer;

Docker 里默认是 JDK 11,如果您的安装环境是使用 JDK8 ,需要在 Docker 里 JDK 环境切换成 JDK8



四、启动FE错误:

找不到或无法加载主类 org.apache.doris.PaloFe

思路可以



尚未解决

Doris官方常见报错处理指导文档

问题相似,可以参考

他的问题是FE挂掉后,启动不起来了



这个关系不大

可能有点用

思考

一、

我用docker build编译完doris后(编译前我有将Docker镜像挂载到本地),关机或重启节点,我还需要去重新启动一下docker吗?还是去本地挂载目录下直接配置运行doris

二、如果恢复到刚扩容重启的时候你会怎么做?

是向往常一样死马当活马医,看到一个解决方法就拿来试试,还是捋顺思路后再动手,没搞清楚问题本质前,宁可搁置,也不让事态继续恶化

其他问题

问题描述

直接在VMvare里面通过设置扩展虚拟磁盘的容量,重启虚拟机时遇到的问题

错误信息

重启后命令行提示如下:

generating “/run/initramfs/rdsosreport.txt”
entering emergencymode. exit the shell to continue
type “journalctl” to view system logs.
you might want to save “/run/initramfs/rdsosreport.txt” to a usb stick or /boot after mounting them and attach it to a bug report。

解决方法

查看设备的信息

# ls /dev/mapper/

这里会显示三个设备,其中有一个: xxxx-root,我的虚拟机是:rhel-root

问题修复:

# xfs_repair /dev/mapper/rhel-root

上述命令执行后,提示: xxxx busy...(大致意思就是:那块设备正在被使用)

此时,需要尝试先卸载那块设备。

# umount /rhel-root

卸载之后,在此尝试修复(此时可以正常修复)

# xfs_repair /dev/mapper/rhel-root

上述命令不能修复,需要添加参数 -L

# xfs_repair /dev/mapper/rhel-root -L

Doris 再次启动FE失败的思考的更多相关文章

  1. 启动OracleDBConsoleorcl失败,提示错误代码2

    异常问题: 启动OracleDBConsoleorcl失败,提示错误代码2 原因分析: 由于更改计算机名导致的异常 解决方法: 1.管理员权限cmd下执行emctl start dbconsole 2 ...

  2. 完全关闭及再次启动cdh集群

    关闭集群 - 关闭集群所有组件 关闭Cloudera Management Service 关闭cdh所有客户端节点 sudo /opt/cloudera-manager/cm-5.11.1/etc/ ...

  3. 启动OpenVPN失败

    启动OpenVPN失败 文:铁乐与猫 [root@yunwei_OpenVPN openvpn]# systemctl status openvpn ● openvpn.service - LSB: ...

  4. MyEclipse 启动 tomcate 失败 解决方法

    MyEclipse中启动tomcate失败 十月 20, 2015 9:53:04 下午 org.apache.catalina.startup.VersionLoggerListener log信息 ...

  5. unity3D Socket连接C#server出现unity3D编辑器再次启动连接 unity3D编辑器马上卡死

    unity3D Socket与C#server第一次连接时通讯正常.客服端段关闭后.unity3D编辑器再次启动连接 unity3D编辑器马上卡死 原因是Socket处于异步状态,而异步线程是不受Un ...

  6. Tomcat学习笔记 - 错误日志 - NetBeans配置tomcat出错情况总结 -- 部署错误: 启动 Tomcat 失败。-- '127.0.0.1' 不是内部或外部命令,也不是可运行的程序

    真的管用,不知道为啥管用.转载自:http://blog.sina.com.cn/s/blog_709548200102vgy4.html 问题描述: 新安装的NetBeans8.0.2,安装过程中还 ...

  7. centos7 启动docker失败的解决

    控制端使用yum install docker安装完成docker后启动docker失败,出现以下信息: Job for docker.service failed because the contr ...

  8. Linux_解决启动网卡失败 Device eth0 does not seem to be present

    Linux_解决启动网卡失败  Device eth0 does not seem to be present 虚拟机克隆  发现service network restart 启动失败 故障现象: ...

  9. 删除了原有的offset之后再次启动会报错park Streaming from Kafka has error numRecords must not ...

          笔者使用Spark streaming读取Kakfa中的数据,做进一步处理,用到了KafkaUtil的createDirectStream()方法:该方法不会自动保存topic parti ...

  10. Android Bug分析系列:第三方平台安装app启动后,home键回到桌面后点击app启动时会再次启动入口类bug的原因剖析

    前言 前些天,测试MM发现了一个比较奇怪的bug. 具体表现是: 1.将app包通过电脑QQ传送到手机QQ上面,点击安装,安装后选择打开app (此间的应用逻辑应该是要触发 [闪屏页Activity] ...

随机推荐

  1. WPF入门教程系列二十四——DataGrid使用示例(1)

    WPF入门教程系列二--Application介绍 WPF入门教程系列三--Application介绍(续) WPF入门教程系列四--Dispatcher介绍 WPF入门教程系列五--Window 介 ...

  2. HTB靶场之Busqueda

    准备: 攻击机:虚拟机kali和win10(常规操作就直接用本机win10来操作了). 靶机:Inject,htb网站:https://www.hackthebox.com/,靶机地址:https:/ ...

  3. 【CF】掉分总结

    比赛总结 前情提要 自从前段时间连续掉分,就心态崩了,还是自己太菜,一直想写个总结,看看这几场比赛都干了啥,以后准备怎么办.鸽了这么久的总结,是该写写了. 这是正文 首先大致提一下情感曲线(菜的真实) ...

  4. < Python全景系列-5 > 解锁Python并发编程:多线程和多进程的神秘面纱揭晓

    欢迎来到我们的系列博客<Python全景系列>!在这个系列中,我们将带领你从Python的基础知识开始,一步步深入到高级话题,帮助你掌握这门强大而灵活的编程语法.无论你是编程新手,还是有一 ...

  5. Linux系统 2023年5月1号

    今天正式进入了LINUX基础核心  下载了centos7.4镜像 和vmware12版本,还未安装vmware和centos镜像7.4

  6. 入门 Python GUI 开发的第一个坑

    由于微信不允许外部链接,你需要点击文章尾部左下角的 "阅读原文",才能访问文中链接. 使用 Anaconda 3(conda 4.5.11)的 tkinter python 包(c ...

  7. Vue3 之 响应式 API reactive、 effect源码,详细注释

    Vue3之响应式 API reactive. effect源码,详细注释 目录 一.实现响应式 API:reactive.shallowReactive.readonly.shallowReadonl ...

  8. Python异步编程之web框架 异步vs同步 数据库IO任务压测对比

    测试基本信息 主题:比较异步框架和同步框架在数据库IO操作的性能差异 python版本:python 3.8 数据库:mysql 8.0.27 (docker部署) 压测工具:locust web框架 ...

  9. CANoe学习笔记(二):创建第一个事件触发帧(基于LIN)

    内容: 创建一个事件触发帧: 包含几个不同无条件帧: 事件触发帧的触发: 事先准备: 创建三个文件夹,用来放不同类型文件: 工程创建 新建一个Lin工程,双击即可,然后命名为LINconf保存. 创建 ...

  10. Python潮流周刊#7:我讨厌用 asyncio

    你好,我是猫哥.这里记录每周值得分享的 Python 及通用技术内容,部分为英文,已在小标题注明.(标题取自其中一则分享,不代表全部内容都是该主题,特此声明.) 首发于我的博客:https://pyt ...