elasticsearch配置集群+elk报错总结

配置ELK的时候，我平常遇到了以下几种报错情况，整理如下（持续更新中）：

elasticsearch启动失败

# systemctl start elasticsearch
Job for elasticsearch.service failed because the control process exited with error code. See "systemctl status elasticsearch.service" and "journalctl -xe" for details.
#这个时候，直接查看系统日志，因为elasticsearch没有专门的日志审计
tail -f /var/log/messages

出现如下报错

Dec 13 10:16:30 oldboy elasticsearch: ERROR: [1] bootstrap checks failed
Dec 13 10:16:30 oldboy elasticsearch: [1]: initial heap size [536870912] not equal to maximum heap size [775946240]; this can cause resize pauses and prevents mlockall from locking the entire heap

其实提示已经很明显了，jvm给的内存不足，那么我们直接把内存调大就可以了

#修改jvm内存大小
# vim /etc/elasticsearch/jvm.options
-Xms1500m
-Xms1500m
#因为刚才把内存改的很小，改回来就行了

如果不是使用的systemd方法启动，直接调用bin/elasticsearch 启动，那么有几点需要注意

#1.不能使用root进行登录
useradd elk #创建用户elk
#2.将涉及的用户权限赋予elk

kibana显示中文乱码

#首先查看要拉取的日志的格式是什么
file file.txt  #在linux上查看
以记事本打开log文件，点击另存为查看，如果显示为ANSI，那么就是gbk  #在windows上查看
#在filebeat中配置字符集
# vim /etc/filebeat/filebeat.yml
filebeat.inputs:
- type: log
  enabled: true
  paths:
    - c:\work\CA*
  encoding: gbk   #此处加入字符格式，如果是utf8，那么不需要添加

继续生成测试日志，登录kibana查看，发现中文字符已经正常显示，没有乱码了。

es集群配置xpack启动后，创建密码失败

[root@db01 elasticsearch]# bin/elasticsearch-setup-passwords interactive
Failed to determine the health of the cluster running at http://10.0.0.200:9200
Unexpected response code [503] from calling GET http://10.0.0.200:9200/_cluster/health?pretty
Cause: master_not_discovered_exception
It is recommended that you resolve the issues with your cluster before running elasticsearch-setup-passwords.
It is very likely that the password changes will fail when run against an unhealthy cluster.
Do you want to continue with the password setup process [y/N]y
Initiating the setup of passwords for reserved users elastic,apm_system,kibana,logstash_system,beats_system,remote_monitoring_user.
You will be prompted to enter passwords as the process progresses.
Please confirm that you would like to continue [y/N]y
#错误原因，因为脏数据的原因，当开始xpack的时候，集群链接失败
#终极大招（只适用于初始创建集群，或者测试环境）
1.停止服务
2.删除数据目录
3.三个节点只配置xpack.security.enabled: true,启动
4.设置密码
#配置文件（三台除了ip之外都一样）
cluster.name: think
node.name: node-1
path.data: /var/lib/elasticsearch
path.logs: /var/log/elasticsearch
bootstrap.memory_lock: true
network.host: 10.0.0.200,127.0.0.1
http.port: 9200
discovery.seed_hosts: ["10.0.0.200", "10.0.0.201"]
cluster.initial_master_nodes: ["10.0.0.200", "10.0.0.201","10.0.0.202"]
http.cors.enabled: true
http.cors.allow-origin: "*"
xpack.security.enabled: true
#测试效果
[root@db01 elasticsearch]# bin/elasticsearch-setup-passwords interactive
Initiating the setup of passwords for reserved users elastic,apm_system,kibana,logstash_system,beats_system,remote_monitoring_user.
You will be prompted to enter passwords as the process progresses.
Please confirm that you would like to continue [y/N]y
Enter password for [elastic]:
Reenter password for [elastic]:
Enter password for [apm_system]:
Reenter password for [apm_system]:
Enter password for [kibana]:
Reenter password for [kibana]:
Enter password for [logstash_system]:
Reenter password for [logstash_system]:
Enter password for [beats_system]:
Reenter password for [beats_system]:
Enter password for [remote_monitoring_user]:
Reenter password for [remote_monitoring_user]:
Changed password for user [apm_system]
Changed password for user [kibana]
Changed password for user [logstash_system]
Changed password for user [beats_system]
Changed password for user [remote_monitoring_user]
Changed password for user [elastic]
#成功

4.隔天上班又出现和标题3同样的情况，如下解决方案

#直接配上ca证书验证，开启ssl
# 设置默认的角色密码
bin/elasticsearch-setup-passwords interactive  #这一步我是不成功的，不过标题3已经创建过了，所以跳过
再elasticsearch.yml加入如下
xpack.security.transport.ssl.enabled: true
xpack.security.transport.ssl.verification_mode: certificate # 证书验证级别
xpack.security.transport.ssl.keystore.path: certs/elastic-certificates.p12 # 节点证书路径
xpack.security.transport.ssl.truststore.path: certs/elastic-certificates.p12
#创建证书
# 创建keystore文件
# bin/elasticsearch-keystore create # config文件夹下有的话这一步就不用再执行了
# 生成CA证书，一直回车
bin/elasticsearch-certutil ca (CA证书：elastic-stack-ca.p12)
# 生成节点使用的证书，一直回车
bin/elasticsearch-certutil cert --ca elastic-stack-ca.p12  (节点证书：elastic-certificates.p12)
# 创建证书保存目录，并移动到config文件下
mkdir -p /etc/elasticsearch/certs
mv elastic-certificates.p12 /etc/elasticsearch/certs
chmod 777 /etc/elasticsearch/certs   #不给授权就无法登录，可以自己测测到底给多少合适
#重启

elasticsearch配置集群+elk报错总结的更多相关文章

elasticsearch集群搭建报错： not enough master nodes discovered during pinging
自己用一台阿里云服务器搭建ES集群的时候,总是报上面的问题. 而且两个ES服务都是报同样的问题.自己的配置文件如下: es服务1配置文件 cluster.name: elasticsearch ...
IMPI Python集群运行报错:
Intel MPI环境利用hostfile多主机运行下报错 HYDU_process_mfile_token (../../utils/args/args.c:523): token slots no ...
执行redis命令redis-trib.rb查看集群信息报错cannot load such file -- redis (LoadError)
问题描述: 在执行redis-trib.rb命令查看集群状态的时候,报错: [aiprd@hadoop1 ~]$ redis-trib.rb check Traceback (most recent ...
ceph-deploy离线部署ceph集群及报错解决FAQ
ceph-deploy部署ceph集群环境介绍主机名 ip地址操作系统角色备注 ceph-node1 10.153.204.13 Centos7.6 mon.osd.mds.mgr.rgw. ...
rabbimq集群搭建报错：Error: unable TO perform an operation ON node 'rabbit@test3'. Please see diagnostics information AND suggestions below.
在搭建rabbitmq集群的时候,添加内存节点时,抛出异常:Error: unable TO perform an operation ON node 'rabbit@test3'. Please s ...
Redis集群创建报错
Redis集群环境:och163/och164/och165 在执行如下脚本时报错: ./src/redis-trib.rb create 10.1.253.163: 10.1.253.164: 10 ...
Elasticsearch配置集群环境
环境选择: 1.方案一:准备三台机器每一台机器一个节点 2.方案二:准备一台机器启动三个节点,用端口号区分即可 3.ES启 ...
HBase 2.1.3 集群 web 报错InvalidProtocolBufferException 解决方法
搭建好HBase 集群后,各种后台进程都正常,搭建手册参考: Hbase 2.1.3 集群搭建手册https://www.cndba.cn/dave/article/3322 但是通过web访问,却报 ...
【问题集】redis集群set报错(error) MOVED 11469 192.168.181.201:7002
没有启动集群模式(即缺少了那个"-c"): redis-cli -c -h yourhost -p yourpost

随机推荐

Winform中设置ZedGraph当前所有曲线的颜色
场景 Winforn中设置ZedGraph曲线图的属性.坐标轴属性.刻度属性: https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/10 ...
Winform中设置ZedGraph鼠标焦点位置画出十字线并在鼠标移出时十字线消失
场景 Winforn中设置ZedGraph曲线图的属性.坐标轴属性.刻度属性: https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/10 ...
Python - 获取本机IP地址、Mac地址
Python - 获取本机IP地址.Mac地址在python中获取ip地址和在php中有很大不同,在php中往往比较简单.那再python中怎么做呢? 直接看代码: # Python - 获取本机I ...
电信NBIOT 2 - 数据上行（中间件获取电信消息通知）
电信NBIOT 1 - 数据上行(中国电信开发者平台对接流程) 电信NBIOT 2 - 数据上行(中间件获取电信消息通知) 电信NBIOT 3 - 数据下行电信NBIOT 4 - NB73模块上行测 ...
liteos互斥锁（七）
1. 概述 1.1 基本概念互斥锁又称互斥型信号量,是一种特殊的二值性信号量,用于实现对共享资源的独占式处理. 任意时刻互斥锁的状态只有两种,开锁或闭锁.当有任务持有时,互斥锁处于闭锁状态,这个任务 ...
springcloud学习之路: (三) springcloud集成Zuul网关
网关就是做一下过滤或拦截操作让我们的服务更加安全用户访问我们服务的时候就要先通过网关然后再由网关转发到我们的微服务 1. 新建一个网关服务Module 2. 依然选择springboot工程 3 ...
详解MongDB数据库
NoSQL 若杀死进程应使用pkill 数据设计模式:分布式.非关系型.不提供ACID 特性:简单数据模型.源数据和应用数据分离.弱一致性优势: 避免不必要的复杂性高吞吐量, 高水平扩展能力和低 ...
浅析struct device结构体
device结构体:设备驱动模型中的基础结构体之一 struct device { /*设备所依附的父设备大多数情况下,这样的设备是某种总线或主控制器如果该成员变量的值为NULL,表示当前设备是一 ...
使用 HuTool时候,遇到Cannot add merged region A1:C1 to sheet because it overlaps with an existing merged region (A1:C1).
java.lang.IllegalStateException: Cannot add merged region A1:C1 to sheet because it overlaps with an ...
使用jmeter进行压力测试及如何添加负载机
Jmeter是一款简单灵活且强大的性能测试工具,同时也可以做接口测试. 由于初识jmeter,今天来记录一下如何对一个web进行一个简单的压力测试. 1.首先在测试计划里面添加一个线程组,然后再其下面 ...

elasticsearch配置集群+elk报错总结

配置ELK的时候，我平常遇到了以下几种报错情况，整理如下（持续更新中）：

elasticsearch配置集群+elk报错总结的更多相关文章

随机推荐

热门专题