1.ELK简介

  这里简单介绍一下elk架构中的各个组件,关于elk的详细介绍的请自行百度

  • Elasticsearch是个开源分布式搜索引擎,是整个ELK架构的核心

  • Logstash可以对数据进行收集、过滤,存储到ELasticsearch中

  • Kibana 可以为 Logstash 和 ElasticSearch 提供的日志分析友好的 Web 界面,可以帮助您汇总、分析和搜索重要数据日志

  

  下面是各个组件在架构中起到的作用

2.组件下载

elasticsearch对版本极其敏感,所以一定要注意elk所有组件务必保持版本一致!

elk组件下载地址》》:https://www.elastic.co/cn/downloads/

3.elasticsearch配置

如果是本机使用elasticsearch基本上解压即用,只需要注意将elasticsearch配置成外网可访问,方法如下:

修改elasticsearch/config目录下的elasticsearch.yml文件

network.host: 0.0.0.0

将network.host设置为0.0.0.0即可开启外网访问,elasticsearch默认端口9200如果需要修改还是在elasticsearch.yml文件中

http.port: 9200

elasticsearch设置数据存储路径以及目录存储路径

path.data: /path/to/data
path.logs: /path/to/logs

启动方式:

  windows下双击elasticsearch.bat启动

  linux下执行elasticsearch启动 -d为后台启动

4.logstash配置

整个elk架构中logstash需要配置的地方最多,首先logstash起到的作用是收集数据导入至elasticsearch中,收集的方法有很多中,关系型数据库,非关系型数据库亦或者文件这里主要讲一下关系型数据库的导入

先贴出笔者的配置文件

input {
jdbc {
     #设置数据库url
jdbc_connection_string => "jdbc:mysql://localhost:3306/elk"
#账号与密码
     jdbc_user => "root"
jdbc_password => "root"
#对应数据库的jar包位置以及jdbc类型
     jdbc_driver_library => "/root/mysql-connector-java-5.1.46.jar"
jdbc_driver_class => "com.mysql.jdbc.Driver"
#每次启动logstash是否重新加载数据
     clean_run => false
#编码格式
     codec => plain { charset => "UTF-8"}
#是否使用user_column_value 记录每次查询的值,这个必须为递增的值,在sql中可以使用:sql_last_value取出该值,如果不设置即默认该值为上次执行sql的时间
     use_column_value => false
     #sql语句位置
statement_filepath => "/root/product_list.sql"
#记录上一次执行时间的文件位置
     last_run_metadata_path => "/root/product_last_run_time.txt"
#使用corn表达式定义执行周期
     schedule => "*/30 * * * * *"
     #多个配置文件时定义该次查询集的名字,方便output、filter进行逻辑处理
type => "test"
  #时区
jdbc_default_timezone => "Asia/Shanghai"
}
}
output {
#使用if判断type
if [type] == "test"{
#输出时的数据类型
stdout { codec => json_lines }
#输出到elasticsearch
elasticsearch {
     #elasticsearch地址
hosts => ["localhost:9200"]
#存储到elasticsearch中的索引名
     index => "test"
     #存到elasticsearch中的类型名
document_type => "test"
     #存到elasticsearch中的id
document_id => "%{id}"
   #使用模板存储到elasticsearch中
template_name => "test"
     #模板位置
template => "/root/logstash-ik.json"
}
}
}

在数据量大的期初导入数据可能会因为数据量太大导致jvm内存溢出,修改logstash/config下jvm.options文件

-Xms1g
-Xmx1g

根据机器配置去修改jvm的最大内存至8g或者更多

如果这样都不能解决内存溢出的问题,笔者这里建议将logstash数据存储从内存放到本地磁盘,这样会牺牲速率但解决了期初数据量太大的问题

修改logstash/config下logstash.yml文件

配置如下:

queue.type: persisted
queue.max_bytes: 10240mb

将queue.type设置为persisted,queue.max_bytes设置队列的最大存储数量

还有一些关于logstash性能上的优化

#logstash同时工作的线程数量,默认为服务器cpu核数,一般在cpu核数的四倍及以下合理
pipeline.workers: 2
#logstash一次操作的数据量,可以根据服务器内存来调整
pipeline.batch.size: 125

还有一些其他的优化可以自行参考logstash.yml文件

5.Kibana配置

Kibana需要修改的配置不多,需要注意如果要开启远程访问Kibana需要修改

KIBANA/config/kibaba.yml下的

server.host:"localhost"更改为

server.host: "0.0.0.0" 就可以远程访问Kibana

关于elk搜索引擎的环境搭建以及配置就到这里,要配置的地方也不多,基本上是开包即用,后面会介绍如何使用关于elasticsearch的使用以及讲解如何使用elk做一个电商平台的搜索引擎。

ELK(elasticsearch+kibana+logstash)搜索引擎(一): 环境搭建的更多相关文章

  1. ELK(elasticsearch+kibana+logstash)搜索引擎(二): elasticsearch基础教程

    1.elasticsearch的结构 首先elasticsearch目前的结构为 /index/type/id  id对应的就是存储的文档ID,elasticsearch一般将数据以JSON格式存储. ...

  2. 【ELK】【docker】【elasticsearch】2.使用elasticSearch+kibana+logstash+ik分词器+pinyin分词器+繁简体转化分词器 6.5.4 启动 ELK+logstash概念描述

    官网地址:https://www.elastic.co/guide/en/elasticsearch/reference/current/docker.html#docker-cli-run-prod ...

  3. Docker安装部署ELK教程(Elasticsearch+Kibana+Logstash+Filebeat)

    Elasticsearch 是个开源分布式搜索引擎,它的特点有:分布式,零配置,自动发现,索引自动分片,索引副本机制,restful风格接口,多数据源,自动搜索负载等. Logstash 是一个完全开 ...

  4. elasticsearch kibana logstash(ELK)的安装集成应用

    官网关于kibana的学习指导网址是:https://www.elastic.co/guide/en/kibana/current/index.html Kibana是一个开源的分析和可视化平台,设计 ...

  5. Elasticsearch,Kibana,Logstash,NLog实现ASP.NET Core 分布式日志系统

    Elasticsearch - 简介 Elasticsearch 作为核心的部分,是一个具有强大索引功能的文档存储库,并且可以通过 REST API 来搜索数据.它使用 Java 编写,基于 Apac ...

  6. ELK日志分析平台系统CentOS7环境搭建和基本使用

    一.搭建环境 系统环境:CentOS7 安装iptables:https://blog.csdn.net/momo_mutou/article/details/81739155 jdk1.8:  ht ...

  7. Elasticsearch+Kibana+Logstash安装

    安装环境: [root@node- src]# cat /etc/redhat-release CentOS Linux release (Core) 安装之前关闭防火墙 firewalld 和 se ...

  8. ELK日志分析系统(1)-基本环境搭建

    1. 概述 ELK = Elasticsearch + Logstash + Kibana Elasticsearch是实时全文搜索和分析引擎,提供搜集.分析.存储数据三大功能:是一套开放REST和J ...

  9. 搜索引擎 ElasticSearch 之 步步为营1 【环境搭建&初识ElasticSearch】

    1.下载ElasticSearch a.下载Java环境JDK:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloa ...

随机推荐

  1. Python3实战系列之五(获取印度售后数据项目)

    问题:续接上一篇.说干咱就干呀,勤勤恳恳写程序呀! 目标:此篇我们试着把python程序打包成.exe程序.这样就可以在服务器上运行了.实现首篇计划列表功能模块的第二步: 2.将python程序转为 ...

  2. js的事件委托机制

    如今的JavaScript技术界里最火热的一项技术应该是‘事件委托(event delegation)’了.使用事件委托技术能让你避免对特定的每个节点添加事件监听器:相反,事件监听器是被添加到它们的父 ...

  3. java8新特性forEach在Map和List的应用

    转自:https://www.cnblogs.com/go-onxp/p/jdk8.html java8 forEach 在Map和List中的使用 原始的使用 Map<String, Inte ...

  4. 1.MFC架构分析

    1.架构代码文件的结构 主要由四个部分组成 1.资源文件Resource.h:主要定义资源的ID 2.预编译文件:stdafx.h 可以用来解决头文件包含冲突的问题,定义一些需要全局性包含的文件. 3 ...

  5. ubuntu 配置jdk报错解决办法

    vi /etc/profile ,添加如下代码 export JAVA_HOME=/home/mark/android/jdk1.8 export JRE_HOME=/home/mark/androi ...

  6. Do More With These Great Plugins for Windows Live Writer(old)

    This article is out of day,now we use open live wirter, but we don’t have so much works great plugin ...

  7. 消息中间件——kafka

    1.1.1 什么是消息中间件 消息中间件利用高效可靠的消息传递机制进行平台无关的数据交流,并基于数据通信来进行分布式系统的集成.通过提供消息传递和消息排队模型,它可以在分布式环境下扩展进程间的通信.对 ...

  8. MySQL基础--字符函数

    1.UPPER和UCASE返回字符串str,根据当前字符集映射(缺省是ISO-8859-1 Latin1)把所有的字符改变成大写.该函数对多字节是可靠的. 2.LOWER和LCASE返回字符串str, ...

  9. 纯css进度条效果

    <!--html代码--> <!DOCTYPE html> <html lang="zh"> <head> <meta cha ...

  10. 利用PHP扩展Taint找出网站的潜在安全漏洞实践

    一.背景 笔者从接触计算机后就对网络安全一直比较感兴趣,在做PHP开发后对web安全一直比较关注,2016时无意中发现Taint这个扩展,体验之后发现确实好用:不过当时在查询相关资料时候发现关注此扩展 ...