使用logstash拉取MySQL数据存储到es中的再次操作

使用情况说明：

已经使用logstash拉取MySQL数据存储到es中，es中也创建了相应的索引，也存储了数据。假若把这个索引给删除了，再次进行同步操作的话要咋做，从最开始的数据进行同步，而不是新增的数据

官方文档地址：https://www.elastic.co/guide/en/logstash/current/plugins-inputs-jdbc.html#plugins-inputs-jdbc-tracking_column

官方原话：

The plugin will persist the sql_last_value parameter in the form of a metadata file stored in the configured last_run_metadata_path. Upon query execution, this file will be updated with the current value of sql_last_value. Next time the pipeline starts up, this value will be updated by reading from the file. If clean_run is set to true, this value will be ignored and sql_last_value will be set to Jan 1, 1970, or 0 if use_column_value is true, as if no query has ever been executed.

翻译：

插件将以sql_last_value元数据文件的形式保存配置文件中的参数last_run_metadata_path。执行查询后，该文件将更新为的当前值sql_last_value。下次管道启动时，将通过从文件中读取来更新此值。如果 clean_run设置为true，则将忽略此值并将其sql_last_value设置为1970年1月1日；如果use_column_value为true，则将其设置为0 ，就好像从未执行过任何查询一样。

具体到操作：

  jdbc {

    jdbc_connection_string => "jdbc:mysql://192.168.0.145:3306/db_example?useUnicode=true&characterEncoding=UTF-8&serverTimezone=UTC"

    jdbc_user => "root"

    jdbc_password => "root"

    jdbc_driver_class => "com.mysql.cj.jdbc.Driver"

    jdbc_driver_library => ""

    jdbc_paging_enabled => true

    tracking_column => "unix_ts_in_secs"

    use_column_value => true

    tracking_column_type => "numeric"

    schedule => "*/5 * * * * *"

    statement => "SELECT *, UNIX_TIMESTAMP(modification_time) AS unix_ts_in_secs FROM es_table WHERE (UNIX_TIMESTAMP(modification_time) > :sql_last_value AND modification_time < NOW()) ORDER BY modification_time ASC"

  }

通过查看jdbc{}语句中的statement，可以知道监控的是unix_ts_in_secs字段值，其值是UNIX_TIMESTAMP(modification_time)过来的

参数last_run_metadata_path默认会从$HOME/.logstash_jdbc_last_run文件中获取最后一次的值，也就是说，数据表中监控的modification_time字段数值，比文件中存储的大，则会拉取数据，否则就不会。

具体到我这边，这个文件的路径是/root/.logstash_jdbc_last_run

[root@bogon ~]# cat /root/.logstash_jdbc_last_run

--- 1589189560

里面存储的是unix时间戳，跟数据表中最后一条数据的modification_time字段值想匹配。

那么接下来，或者修改这个文件里的时间戳值为数据表中modification_time字段最早的那个值，或者删除这个文件，然后再次执行拉取命令即可实现想要的再次同步数据到es的效果。

使用logstash拉取MySQL数据存储到es中的再次操作的更多相关文章

Logstash：把MySQL数据导入到Elasticsearch中
Logstash:把MySQL数据导入到Elasticsearch中前提条件需要安装好Elasticsearch及Kibana. MySQL安装根据不同的操作系统我们分别对MySQL进行安装.我 ...
1.scrapy爬取的数据保存到es中
先建立es的mapping,也就是建立在es中建立一个空的Index,代码如下:执行后就会在es建lagou 这个index. from datetime import datetime fr ...
FLUME安装&环境（二）:拉取MySQL数据库数据到Kafka
Flume安装成功,环境变量配置成功后,开始进行agent配置文件设置. 1.agent配置文件(mysql+flume+Kafka) #利用Flume将MySQL表数据准实时抽取到Kafka a1. ...
Hive 如何快速拉取大批量数据
用hive来做数仓类操作,或者大数据的运算,是没有疑问的,至少在你没有更多选择之前. 当我们要hive来做类似于大批量数据的select时,也许问题就会发生了变化. 1. 通用解决方案之分页首先,我 ...
Web自动化框架之五一套完整demo的点点滴滴（excel功能案例参数化+业务功能分层设计+mysql数据存储封装+截图+日志+测试报告+对接缺陷管理系统+自动编译部署环境+自动验证false、error案例）
标题很大,想说的很多,不知道从那开始~~直接步入正题吧个人也是由于公司的人员的现状和项目的特殊情况,今年年中后开始折腾web自动化这块:整这个原因很简单,就是想能让自己偷点懒.也让减轻一点同事的苦力 ...
修改mysql数据存储的地址
修改mysql数据存储的地址修改步骤如下 1,修改前为默认路径/var/lib/mysql/,计划修改为/data/mysql/data mysql> show variables like ...
ElasticSearch 学习记录之分布式文档存储往ES中存数据和取数据的原理
分布式文档存储 ES分布式特性屏蔽了分布式系统的复杂性集群内的原理垂直扩容和水平扩容真正的扩容能力是来自于水平扩容–为集群添加更多的节点,并且将负载压力和稳定性分散到这些节点中 ES集群特点 ...
Window中的Docker 拉取Mysql镜像并在本地Navicate链接
首先本地拉取mysql镜像以下是所有mysql镜像我自己下载的为5.6 下面以5.6为例:(拉取mysql5.6镜像) docker pull mysql:5.6 创建一个容器 doc ...
修改mysql数据存储位置
停止mysql服务. 在mysql安装目录下找到mysql配置文件my.ini. 在my.ini中找到mysql数据存储位置配置datadir选项,比如我电脑上的配置如下: # Path to the ...

随机推荐

springboot connecting to :mongodb://127.0..0.1:27017/test authentication failed
账号的权限不够,可能是insert进去的脚本的角色有问题 use admin db.createUser({user:'账号',pwd:'密码',roles:[{role:'userAdminAnyD ...
sqlDeveloper工具快速入门
场景我们在连接oracle数据库的时候常用方式一般有以下三种: pl/sql deceloper navicat sqlDeveloper 其中, pl/sql developer是最经典的,也是 ...
gitlab+jenkins自动构建jar包并发布
一.背景介绍: 公司软件都是java开发的,一般都会将java代码打包成jar包发布:为了减轻运维部署的工作量,合理偷懒,就需要自动化流程一条龙服务:开发将代码提交到gitlab--->jenk ...
Deployment之滚动更新策略。
1.Deployment控制器详细信息中包含了其更新策略的相关配置.kubectl describe命令中输出的StrategyType.RollingUpdateStrategy字段等: root@ ...
2536-springsecurity系列--关于session管理1
版本信息 <parent> <groupId>org.springframework.boot</groupId> <artifactId>spring ...
React报错之Object is possibly null
正文从这开始~ 类型守卫使用类型守卫来解决React中useRef钩子"Object is possibly null"的错误.比如说,if (inputRef.current) ...
Prometheus+Grafana+钉钉部署一个单机的MySQL监控告警系统
GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源. GreatSQL是MySQL的国产分支版本,使用上与MySQL一致. 目录一.Prometheus 二.exporter ...
开源风吹动开源心 ~ 8月16日，你若来，我们(Apache)在等你！
点击上方蓝字关注ALC Beijing 抢! 太好看了吧! 买它,就是它,买它! 要抢! ALC是Apache Local Community的缩写,是全世界范围的 Apache 开源爱好者本地群组. ...
java-流的使用完结与异常处理机制
1.1java.io.objectInputStream 对象输入流:用于将一组字节(通过对象输出流写出对象而转换的一组字节)读取并转换为对应的对象.对象输出流将对象写出时转换为一组字节的过程,称为: ...
python常量与变量的本质
python语法常量与变量的本质 python语法之注释 1.python语法注释有哪几种? (1.)单行注释 # 井号键单行注释使用方法:首先在另起一行按('#')井号键进行注释,如果需要代码后面 ...

使用logstash拉取MySQL数据存储到es中的再次操作

使用logstash拉取MySQL数据存储到es中的再次操作的更多相关文章

随机推荐

热门专题