一、前言

大数据处理是流行的一些表现，在不断壮大的数据处理中，怎么样处理数据才是我们继续做好开发的正道。本文章来自网络，不敢原创，但是也有很大借鉴。

二、MAC安装ELK

首先是安装elasticsearch，这个很简单：

brew install elasticsearch

但是这里就遇到了问题，我的java是1.6的，而elasticsearch需要1.7以下版本，所以还需要安装java 1.7而要安装java 1.7，用简单的brew又不行，还需要先安装cask，所以最后的步骤就变成了这样：

brew install brew-cask

brew update

brew cask install caskroom/versions/java7

java -version

可以看到java版本已经是1.7了。接下来：

brew install elasticsearch

elasticsearch --version

证明elasticsearch已经安装好了。以后要启动或者停止elasticsearch服务就执行以下命令：

brew services start elasticsearch

brew services stop elasticsearch

下面安装logstash:

brew install logstash

logstash --version

logstash已经安装好了。然后安装kibana，kibana的安装不用brew，直接下载解压之后，进到解压目录里：

./kibana

接下来是配置logstash，在这里我遇到了大麻烦。从头说起，先要建立一个logstash的conf文件，以便于后期调试：

mkdir logstash

cd logstash

生成一个logstash.conf文件，在这里我们准备处理apache的log

input {

    file {

        path => "/private/var/log/apache2/www.myserver.com-access_log"

        start_position => beginning

        ignore_older => 0

        sincedb_path => "/dev/null"

    }

}

filter {

    grok {

        match => { "message" => "%{IPORHOST:clientip} - %{USER:auth} \[%{HTTPDATE:timestamp}\] \"(?:%{WORD:verb} %{NOTSPACE:request}(?: HTTP/%{NUMBER:httpversion})?|%{DATA:rawrequest})\" %{NUMBER:response} (?:%{NUMBER:bytes}|-)"}

    }

    date {

        match => [ "timestamp" , "dd/MMM/YYYY:HH:mm:ss +0800" ]

    }

}

output {

    elasticsearch {}

    stdout {}

}

为了这个配置文件，费了很大精力，网上很多教程都和我的实际情况不相符合。关键点说明如下：
start_position => beginning告诉logstash从我的log文件的头部开始往下找，不要从半中间开始。
ignore_older => 0告诉logstash不要管我的log有多古老，一律处理，否则logstash缺省会从今天开始，就不管老日志了。
sincedb_path => "/dev/null"这句话也很关键，特别是当你需要反复调试的时候，因为logstash会记住它上次处理到哪儿了，如果没有这句话的话，你再想处理同一个log文件就麻烦了，logstash会拒绝处理。现在有了这句话，就是强迫logstash忘记它上次处理的结果，从头再开始处理一遍。
filter下面的grok里面的match，网上教程一般是这么写的：

match => { "message" => "%{COMBINEDAPACHELOG}" }

但是当我这么写的时候，总是处理不了我的log，我的log其实就长这个样子：

127.0.0.1 - - [02/May/2016:22:11:28 +0800] "GET /assets/aa927304/css/font-awesome.min.css HTTP/1.1" 200 27466

查源代码，官方是这么写的：

COMMONAPACHELOG %{IPORHOST:clientip} %{USER:ident} %{USER:auth} \[%{HTTPDATE:timestamp}\] "(?:%{WORD:verb} %{NOTSPACE:request}(?: HTTP/%{NUMBER:httpversion})?|%{DATA:rawrequest})" %{NUMBER:response} (?:%{NUMBER:bytes}|-)

COMBINEDAPACHELOG %{COMMONAPACHELOG} %{QS:referrer} %{QS:agent}

后面的combined引用前面的common，而问题就出在这个USER:ident上。
我在https://grokdebug.herokuapp.com/反复验证，最后发现只要把这个USER:ident改成-就行了，所以就有了我上面的写法。
接下来用了一个date filter，这是因为如果不用这个date filter的话，它会把处理log的时间认为是用户访问网页的时间来产生表格，这样在kibana里看上去怪怪的，所以加这么一个filter，但就是加这么一个简单的filter，也出现了问题，处理失败，因为网上的教程里一般都是这么写的：

date {

    match => [ "timestamp" , "dd/MMM/YYYY:HH:mm:ss Z" ]

}

区别就在最后一个Z上，我的时区字符串是+0800，怎么也匹配不上这个Z，索性一怒之下直接用+0800代替，也就过关了。
过程中不停地访问如下网址验证elasticsearch的结果：
http://localhost:9200/logstas...
注意URL中那个时间，一开始的时候我们就用处理日志的时间访问就可以，但当加上date filter后就不一样了，如果你还用当前日期的话，会一无所得，改成log里的时间才会看到结果，因为index日期变了。
然后就是你需要一遍一遍地清空elasticsearch里的数据，进行调试：

curl -XDELETE 'http://localhost:9200/_all'

清空完了以后你再执行logstash，就把新数据又灌进去了：

logstash agent -f ~/logstash/logstash.conf

最后，通过kibana窗口观察你的结果：
http://localhost:5601
一开始是在setting页面，要你指定访问的index，这里就用缺省的logstash-*就行了，然后就是页面右上角有个时间限制，把它改成Year to date，否则有可能什么数据也看不到。

在Mac平台上安装配置ELK时的一些总结的更多相关文章

一网成擒全端涵盖，在不同架构(Intel x86/Apple m1 silicon)不同开发平台(Win10/Win11/Mac/Ubuntu)上安装配置Python3.10开发环境
原文转载自「刘悦的技术博客」https://v3u.cn/a_id_200 时光荏苒,过隙白驹,即将进入2022年,著名敏捷开发语言Python也放出了3.10最终版,本次我们来展示一下在不同的系统和 ...
如何在Windows平台下安装配置Memcached
Memcached是一个自由开源的,高性能,分布式内存对象缓存系统. Memcached是以LiveJournal旗下Danga Interactive公司的Brad Fitzpatric为首开发的一 ...
Mac(Linux)上安装memcached步骤
Mac上安装memcached类似于在Linux平台上安装memcached. 主要需要做两块: 一.安装libevent库: 二.安装memcached; 一.安装libevent库 libeven ...
caffe学习(1):多平台下安装配置caffe
如何在 centos 7.3 上安装 caffe 深度学习工具有好多朋友在安装 caffe 时遇到不少问题.(看文章的朋友希望关心一下我的创业项目趣智思成) 今天测试并整理一下安装过程.我是在阿 ...
linux上安装配置samba服务器
linux上安装配置samba服务器在linux上安装配置samba服务器在这给大家介绍一个不错的家伙,samba服务.如果您正在犯愁,如何在Windows和Linux之间实现资源共享,就请看看这 ...
如何在Ubuntu 16.04上安装配置Redis
如何在Ubuntu 16.04上安装配置Redis Redis是一个内存中的键值存储,以其灵活性,性能和广泛的语言支持而闻名.在本指南中,我们将演示如何在Ubuntu 16.04服务器上安装和配置Re ...
Windows 7上安装配置TensorFlow-GPU运算环境
Windows 7上安装配置TensorFlow-GPU运算环境 1. 概述在深度学习实践中,对于简单的模型和相对较小的数据集,我们可以使用CPU完成建模过程.例如在MNIST数据集上进行手写数字识 ...
ubuntu16.04上安装配置DHCP服务的详细过程
DHCP服务器是为客户端机器分配IP地址的,所有分配的IP地址都保存在DHCP服务器的数据库中.为了在子网中实现DHCP分配IP地址,需要在目标主机上安装配置DHCP服务 1. 安装DHCP服务安装 ...
在Centos 7上安装配置 Apche Kafka 分布式消息系统集群
Apache Kafka是一种颇受欢迎的分布式消息代理系统,旨在有效地处理大量的实时数据.Kafka集群不仅具有高度可扩展性和容错性,而且与其他消息代理(如ActiveMQ和RabbitMQ)相比,还 ...

随机推荐

Python学习（十三） —— 网络编程
一.操作系统基础操作系统(Operating System):OS是管理和控制计算机硬件和软件资源的计算机程序,是直接运行在“裸机”上的最基本的系统软件,任何其他软件都必须在操作系统的支持下才能运行 ...
ConcurrentModificationException（并发修改异常）的解决
[异常解释] ConcurrentModificationException:当方法检测到对象的并发修改,但不允许这种修改时,抛出此异常.[产生的原因] 迭代器是依赖于集合而存在的,在判断成功后,集合 ...
041 SparkSql的回顾与复习
在前面学完了SparkCore后,又学了SparkSQL,在继续加深学习之前,一定的复习还是很重要的.这里大体写一下,加深自己对SparlSQL的理解. 1.SparkSQL 首先是SaprkSQL与 ...
Trident中的DRPC实现
一:介绍 1.说明 Storm里面引入DRPC主要是利用storm的实时计算能力来并行化CPU intensive的计算.DRPC的storm topology以函数的参数流作为输入,而把这些函数调用 ...
20165235 学习基础和C语言基础调查
20165235 学习基础和C语言基础调查首先第一个问题:你有什么技能比大多人(超过90%以上)更好?感觉很难回答这种问题,其实我对很多东西挺感兴趣的,如果非要拿出一种比较突出的技能的话我感觉就是象 ...
牛客练习赛35-函数的魔法-floyd
函数的魔法思路 :如果可以从A到B最终都会是233范围内的数字进行转换,注意这里建图为单向图这个运算未必符合交换关系. #include<bits/stdc++.h> us ...
Unity容器中AOP应用示例程序
转发请注明出处:https://www.cnblogs.com/zhiyong-ITNote/p/9127001.html 实在没有找到Unity容器的AOP应用程序示例的说明,在微软官网找到了教程( ...
快速上手Git
本文主要摘录于廖雪峰的Git教程,个别地方做了可能不恰当的修改或补充,主要方便自己回顾.查看更详细内容请移步廖老师博客.同时,感谢廖老师写出这么好的入门指导. (有彩蛋!!!) 一.热身 1.初始化一 ...
[Python]Marshmallow 代码
schema.dump和schema.load schema.dump()方法返回一个MarshResult的对象,marshmallow官方API说dump和load方法返回的都是dict对象,但查 ...
BZOJ.1566.[NOI2009]管道取珠(DP 思路)
BZOJ 洛谷考虑\(a_i^2\)有什么意义:两个人分别操作原序列,使得得到的输出序列都为\(i\)的方案数.\(\sum a_i^2\)就是两人得到的输出序列相同的方案数. \(f[i][j][ ...

在Mac平台上安装配置ELK时的一些总结

一、前言

二、MAC安装ELK

在Mac平台上安装配置ELK时的一些总结的更多相关文章

随机推荐

热门专题