日志服务化&可视化&统计化

概述：

ELK是Elasticsearch(简称es)、Logstash、Kibana的简称，这三者是核心套件，但并非全部。

Filebeat 日志采集工具 Logstash数据处理引擎 elasticsearch数据的存储，并作权威的检索 kibana从 elasticsearch数据库读取并展示

结构图：

备注：

也可通过python把日志传到Elasticsearch，Kibana再展示数据

我目前就是python+Elasticsearch+Kibana

语法案例：

Elasticsearch-head 语法：

################################################API查询篇#######################################################################

1.bool 查询

bool 查询可以把任意多个简单的查询组合在一起，使用 must、should、must_not、filter 选项来表示简单查询之间的逻辑。

(1) must: 文档必须匹配must选项下的从查询条件，相当于逻辑运算的 AND。

(2) should: 文档可以匹配也可以不匹配should选项下的查询条件，相当于逻辑运算的 OR。

(3) must_not: 与must相反。

(4) filter: 与must一样，只不过filter不参与评分，只起到过滤功能。

#post/GET-查询chen索引下， title等于小明123（http://192.168.20.187:9200/chen/_search）

#post/GET-查询所有索引下，title等于小明123（http://192.168.20.187:9200/_search）

{

     "query": {

          "bool": {

               "must": [

                    {

                         "term": {

                              "title.keyword": "小明123"

                         }

                    }

               ],

               "must_not": [],

               "should": []

          }

     },

     "from": 0,

     "size": 10,

     "sort": [],

     "aggs": {}

}

2.constant_score查询

constant_score 查询可以包装一个其他类型的查询

#POST/GET-查询chen索引下， title等于小明（http://192.168.20.187:9200/chen/_search）

{

     "query": {

          "constant_score": {

               "filter": {

                    "term": {"title.keyword": "美国留给伊拉克的是个烂摊子吗33366666666666"}

               },

               "boost": 1.2

          }

     }

}

3.wildcard-模糊匹配-字符串

#GET/POST-查询chen索引下， title包含 小明（http://192.168.20.187:9200/chen/_search）

{

     "query": {

          "bool": {

               "must": [

                    {

                         "wildcard": {

                              "title.keyword": "*小明*"

                         }

                    }

               ],

               "must_not": [],

               "should": []

          }

     }

}

4.prefix-匹配开头-字符串

#POST/GET-查询chen索引下， title以'小明123'开头的内容（http://192.168.20.187:9200/chen/_search）

{

    "query": {

        "prefix" : { "title.keyword" : "小明123" }

    }

}

5.regexp-正则匹配

#POST/GET-查询chen索引下， title包含数字记录（http://192.168.20.187:9200/chen/_search）

{

  "query": {

    "regexp": {

      "title": "[0-9]{2,10}"

    }

  }

}

6.匹配汉字、数字

{

  "query": {

    "regexp": {

      "title": "[0-9\u4e00-\u9fa5]+"

    }

  }

}

7.获取age包含小明，title不包含666的记录

{

     "query": {

          "bool": {

               "must": [

                    {

                         "term": {

                              "age.keyword": "小明"

                         }

                    }

               ],

               "must_not": [{

                         "term": {

                              "title.keyword": "666"

                         }

                    }],

               "should": []

          }

     }

}

8.should-满足title或age任意一个即可

{

  "query": {

    "bool": {

      "should": [

        {"term": {"title.keyword": "美国留给伊拉克的是个烂摊子吗333"}},

        {"term": {"age.keyword": "66666666666666666666"}}

      ]

    }

  }

}

9.must-同时满足title和age才查询

{

  "query": {

    "bool": {

      "must": [

        {"term": {"title.keyword": "999955522222"}},

        {"term": {"age.keyword": "66666666666666666666"}}

      ]

    }

  }

}

10.查询索引下所有数据

方法一：

GET或者POST  索引名/类型/_search

{

  "query": {

    "match_all": {}

  }

}

方法二(无需参数)：

GET 索引名/类型/_search

#######################################################API新增篇(类型默认为_doc)###########################################################################

###指定id插入数据

###PUT-http://192.168.20.187:9200/索引名/类型/自定义id

{

    "name":"瓦力",

    "country":"China",

    "age":300,

    "date":"1987-3-7"

}

###输入自动生成id

###post-http://192.168.20.187:9200/索引名/类型/

{

    "name":"瓦力",

    "country":"China",

    "age":300,

    "date":"1987-3-7"

}

####################################################################API更新数据#############################################################

#########更新数据

###post-http://192.168.20.187:9200索引名/类型/_update

{

    "name": "瓦力2333333333333333333"

}

##也可以这样写(detect_noop默认为true)

{

    "doc" : {

        "name" : "new_name"

    },

    "detect_noop": false

}

'''

默认情况下只有原来的source和新的source存在不同的字段情况下才会重建索引，如果一模一样是不会触发重建索引的，如果将detect_noop=false不管内容有没有变化都会重建索引，这一点可以通过version的值的变化来发现更新的文档，必须提前存在.

'''

######有就覆盖、没有则新增

###post-http://192.168.20.187:9200索引名/类型/_update

##方式一：

{

    "doc": {

        "address": "北京朝阳2"

    },

    "doc_as_upsert": true

}

##方式二：

{

    "address": "北京朝阳23"

}

###############################################################################API删除篇######################################################################################

######################################################post-http://192.168.20.187:9200/索引名/类型/_delete_by_query

###通过id删除

{

  "query":{

    "term":{

      "_id":"10"

    }

  }

}

###普通条件删除，age=300的数据

{

  "query":{

    "term":{

      "age":"300"

    }

  }

}

###删除所有数据：（注意请求方式是Post，只删除数据，不删除表结构）

###post-http://192.168.20.187:9200/索引名/类型/_delete_by_query?pretty

{

    "query": {

        "match_all": {

        }

    }

}

########__________________________________结构操作-API篇______________________________________________________

####删除索引库(使用Delete方法)

#Delete-http://192.168.20.187:9200/索引名

##新增索引库

#PUT-http://192.168.20.187:9200/索引名

##查看索引结构

GET /dalan_index/_mapping?pretty

##创建带有类型、映射的索引(Index)

#PUT-http://192.168.20.187:9200/索引名?pretty

#入参json：

{

    "settings": {

        "number_of_shards": 3,

        "number_of_replicas": 2

    },

    "mapping": {

        "_doc": {

            "properties": {

                "commodity_id": {

                    "type": "long"

                },

                "commodity_name": {

                    "type": "text"

                },

                "picture_url": {

                    "type": "keyword"

                },

                "price": {

                    "type": "double"

                }

            }

        }

    }

}

备注：可直接使用postman等工具查询，例如：

python3对接elasticsearch(es)

#!/usr/bin/env python

# -*- coding: utf-8 -*-

from elasticsearch import Elasticsearch

import datetime

import json

######____________________________连接es创建索引库______________________________________________________________

###连接es

es = Elasticsearch(host="192.168.20.187", port=9200)

#创建dalan_test索引库(相当于创建一个表)

result = es.indices.create(index='dalan_test', ignore=400)

print(result)

### ignore标记成400  的意思是我们忽略状态码为400的错误

### acknowledged字段显示True  表示索引创建成功

###___________________________#插入数据(需要先有索引库)____________________________________________________________

data = {"name": "小美", "age": "18", "gender": "女"}

#####方式一：index

# ####插入数据,不传id默认自动生成

# res = es.index(index='chen', doc_type='_doc', body=data)

# print(res)

#####方式二：create

#####create方式插入需要指定id且不能重复

# result = es.create(index='dalan_test', doc_type='_doc',id=10, body=data)

# print(result)

##########################批量插入数据

####连接es

# es_client = Elasticsearch(["192.168.20.187:9200"], timeout=20)

# #创建索引

# es_client.indices.create(index='test_test_test', ignore=400)

# #需要插入的数据

# body1 = {"func_info":"删除日志", "error_info":"333", "write_date":datetime.datetime.now()}

# body2 = {"func_info":"删除日志", "error_info":"id为空22233", "write_date":datetime.datetime.now()}

# #组装数据

# #两条数据({'index': {'_index': 'log_index', '_type': 'log_index'}}...................描述）

# result = [{'index': {'_index': 'test_test_test', '_type': 'log_index'}}, body1,{'index': {'_index': 'test_test_test', '_type': 'log_index'}}, body2]

# #提交数据

# es_result = es_client.bulk(index="test_test_test",doc_type="log_index", body= result)

# es_client.indices.flush()

###_________________________________________________查询所有数据________________________________________________________________

###方式一：

# data = es.search(index='chen')

# print(data)

#

# ###方式二：推荐

# body = {

#         'query':{

#         'match_all':{}

#          }

#     }

# data = es.search(index='chen', body=body)

# print(json.dumps(data))

################################## term: 根据某个字段的值进行查询数据

##es 官方文档： term 和 terms 是 包含（contains） 操作，而非 等值（equals） （判断）

# body2 =  {

#          "query":{

#            "term":{

#               "age": "66666666666666666666"}

#                   }

#                 }

# data_list = es.search(index='chen', body=body2)

# print(data_list)

###terms: 根据某个字段的多个值进行查询数据

# body3 =  {

#          "query":{

#            "terms":{

#               "title": ["6662222222222222222222222","美国留给伊拉克的是个烂摊子吗"]}

#                   }

#                 }

# age_list = es.search(index='chen', body=body3)

# print(age_list)

###查询tilte字段以xxx结尾的数据

# body = {

#     "query":

#         {

#         "wildcard":

#             {

#             "title.keyword": "*吗333"

#         }

#     }

# }

# # 查询name字段以红结尾的数据

# aa=es.search(index="chen",body=body)

# print(aa)

###__________________________________________________删除数据________________________________________________

###指定id删除

# result = es.delete(index='chen', doc_type='politics', id=3)

# print(result)

###根据id删除

# name = {"query":{"match":{"_id":"2"}}}

# result = es.delete_by_query(index="索引名", body=name, doc_type="_doc")

# print(result)

###删除索引

# res = es.indices.delete('索引名')

# print(res)

###删除索引的所有数据(清空索引-保留结构)

# delete_name = {"query":{"match_all":{}}}

# result = es.delete_by_query(index="test_test_test", body=delete_name, doc_type="log_index")

# print(result)

####______________________________________________更新数据__________________________________________________________

updateBody = {

            'doc': {

                "title":"我这是2021-10-29后面修改的数据"

            }

        }

res = es.update(index='chen', doc_type='politics', id='yMS4y3wBK5zUkjFjYOFQ', body=updateBody)

print(res)

es自动添加时间戳：

需求：根据时间提取es数据
解决：为es的记录添加时间戳

es5.0后采用的是pipeline的方式来自动添加时间戳：

1.配置时间戳pipeline

PUT _ingest/pipeline/my_timestamp_pipeline

{

  "description": "Adds a field to a document with the time of ingestion",

  "processors": [

    {

      "set": {

        "field": "ingest_timestamp",

        "value": "{{_ingest.timestamp}}"

      }

    }

  ]

}

2.创建索引时使用时间戳pipeline

PUT my_index

{

  "settings": {

    "default_pipeline": "my_timestamp_pipeline"

  }

}

3.创建数据验证：

备注:可以不指定id，由系统自动生成,也可以使用post方法

POST-http://192.168.20.187:9200/dalan_api/_doc

PUT my_index/_doc/1

{

  "content": "it is cool!"

}

日志服务化&可视化&统计化的更多相关文章

ELK 6安装配置 nginx日志收集 kabana汉化
#ELK 6安装配置 nginx日志收集 kabana汉化 #环境 centos 7.4 ,ELK 6 ,单节点 #服务端 Logstash 收集,过滤 Elasticsearch 存储,索引日志 K ...
【Spring Cloud & Alibaba全栈开源项目实战】：SpringBoot整合ELK实现分布式登录日志收集和统计
一. 前言其实早前就想计划出这篇文章,但是最近主要精力在完善微服务.系统权限设计.微信小程序和管理前端的功能,不过好在有群里小伙伴的一起帮忙反馈问题,基础版的功能已经差不多,也在此谢过,希望今后大家 ...
geotrellis使用（十五）使用Bokeh进行栅格数据可视化统计
Geotrellis系列文章链接地址http://www.cnblogs.com/shoufengwei/p/5619419.html 目录前言实现方案总结一.前言之前有篇文章 ...
Log4j/Log4j2自定义Appender来实现日志级别计数统计及监控
一.简述本文主要讲如何基于Log4j2来实现自定义的Appender.一般用途是用于Log4j2自带的Appender不足以满足我们的需求,或者需要我们对日志进行拦截统计等操作时,需要我们自定义Ap ...
重新整理 .net core 实践篇—————日志系统之结构化[十八]
前言什么是结构化呢? 结构化,就是将原本没有规律的东西进行有规律话. 就比如我们学习数据结构,需要学习排序然后又要学习查询,说白了这就是一套,没有排序,谈如何查询是没有意义的,因为查询算法就是根据某 ...
【原创】基于日志增量，统计qps，并基于ip排序
增量统计日志行数(只统计上一秒) dns_qps.py #!/usr/bin/env python #_*_coding:utf-8_*_ import datetime import re impo ...
使用Spark进行搜狗日志分析实例——统计每个小时的搜索量
package sogolog import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext} /* ...
日志分析-mime统计
提取日志中未落入标准字段的mime,分adx,adtype 统计mime的数量和包含js的数量占比 require 'date' require 'net/http' require 'uri' re ...
对MySQL binlog日志解析，统计每张表的DML次数
想要获取每天数据库每张表的DML的次数,统计热度表,可以使用该脚本 # coding:utf-8 # 解析binlog,统计热度表,表的DML个数 import sys import os # mys ...
nginx日志分析及其统计PV、UV、IP
一.nginx日志结构 nginx中access.log 的日志结构: $remote_addr 客户端地址 211.28.65.253 $remote_user 客户端用户名称 -- $time_l ...

随机推荐

elasticsearch之使用正则表达式自定义分词逻辑
一.Pattern Analyzer简介 elasticsearch在索引和搜索之前都需要对输入的文本进行分词,elasticsearch提供的pattern analyzer使得我们可以通过正则表达 ...
一文详解 jitpack 多渠道maven库发布
先说一下,为什么会有这篇文章? 最初接触 JitPack 时,发现网络上大量涉及JitPack的教程不可用.通过两天的研究才搞明白: 1.不同的gradle版本,gradle api使用方式与 Ji ...
CPU AMX 详解
CPU AMX 详解 CPU AMX 详解概述算力如何问题定义 AVX如何解决矩阵乘问题 AMX如何解决矩阵乘问题如何实现的计算部分数据部分路才开始概述 2016 年开始,随着 NV ...
我用ChatGPT做直播技术选型，卷死了同事
摘要近两年即时通讯/直播产品炙手可热,市场上针对ToB的产品日益增多,企业该如何去选型呢?本文分享了笔者对于直播产品的思考,将从直播SDK实例功能特性.常见业务场景.注意事项及最佳实践等方面介绍如何 ...
免杀之：MSF后门metasploit-loader免杀
免杀之:MSF后门metasploit-loader免杀目录免杀之:MSF后门metasploit-loader免杀 1 metasploit-loader后门代码 2 在kali中编译metas ...
01#Vue Transition 过渡：基于 CSS 过渡
过渡的阶段上图是过渡的 6 个阶段示意图.总体是进入和离开两个阶段,进入和离开又各自有两个阶段.下表格是对每一个阶段的解释: 进入和离开实现过渡效果使用的是 CSS 样式,过度的样式相当于重写覆盖了 ...
轻量级CI/CD发布部署环境搭建及使用_01_基本介绍
轻量级CI/CD发布部署环境搭建及使用_01_基本介绍授人以鱼不如授人以渔,如果说的别人都没明白,说明自己实际也不是太明白最终实现效果如图 1,选择相应环境下的项目,执行构建注: web:vue ...
Postgresql索引浅析
一.摘要 1.索引是提高数据库性能的常用途径.比起没有索引,使用索引可以让数据库服务器更快找到并获取特定行.但是索引同时也会增加数据库系统的日常管理负担,因此我们应该聪明地使用索引. 2.索引其实就是 ...
Java Agent场景性能测试分析优化经验分享
摘要:本文将以Sermant的SpringBoot 注册插件的性能测试及优化过程为例,分享在Java Agent场景如何进行更好的性能测试优化及在Java Agent下需要着重注意的性能陷阱. 作者: ...
时钟切换电路（无毛刺）——clock switching glitch free
0.引言随着越来越多的多频时钟被应用在今天的芯片中,尤其是在通信领域中,经常需要在芯片运行时切换时钟线的源时钟.这通常是通过在硬件中复用两个不同的频率时钟源,并通过内部逻辑控制多路选择器选择线来实现 ...