es之java插入优化（批量插入）

插入文档操作的一种优化，因为每次插入单条文档，都会向es中发送请求。然后es执行在返回结果；

如果有大批量的文档数据需要插入，这个时候单挑插入操作显然是不合理的；

之前学习的命令行批量执行方式：

POST /_bulk

{ "delete": { "_index": "website", "_type": "blog", "_id": "123" }}

{ "create": { "_index": "website", "_type": "blog", "_id": "123" }}

{ "title":    "My first blog post" }

{ "index":  { "_index": "website", "_type": "blog" }}

{ "title":    "My second blog post" }

{ "update": { "_index": "website", "_type": "blog", "_id": "123", "_retry_on_conflict" : 3} }

{ "doc" : {"title" : "My updated blog post"} }

1：普通的批量插入方式

 @Test

    public void BulkInsertDocument() throws IOException {

        BulkRequestBuilder bulkRequest = client.prepareBulk();

// either use client#prepare, or use Requests# to directly build index/delete requests

        bulkRequest.add(client.prepareIndex("weibo", "article", "1")

                .setSource(jsonBuilder()

                        .startObject()

                        .field("user", "张三")

                        .field("postDate", new Date())

                        .field("message", "近段时间关于马蓉的消息传得到处都是，而且我们也发现她这一段时间似乎小动作不断。对于她近期的所做所为，王宝强方面则显得冷静一些，要求法庭二审选择公开审理。")

                        .endObject()

                )

        );

        bulkRequest.add(client.prepareIndex("weibo", "article", "2")

                .setSource(jsonBuilder()

                        .startObject()

                        .field("user", "王二")

                        .field("postDate", new Date())

                        .field("message", "新浪2016里约奥运站为您全程报道第31届里约夏季奥林匹克运动会,金牌榜,赛程赛果,赛事直播,高清图片,中国队比赛信息第一时间推送,与奥运人物微博互动")

                        .endObject()

                )

        );

        BulkResponse bulkResponse = bulkRequest.get();

        if (bulkResponse.hasFailures()) {

            // process failures by iterating through each bulk response item

        }

    }

这种方式也会有问题，比如在批量插入的时候，多大数据量插入一次，多少条插入一次，多少秒插入一次这样的定时定量的优化都是没有的，那么接下来让我们在看一下批量插入的优化操作

2：优化后的批量执行方式

@Test

    public void BulkInsertDocumen2t() throws Exception {

        BulkProcessor bulkProcessor = BulkProcessor.builder(client, new BulkProcessor.Listener() {

            //todo beforeBulk会在批量提交之前执行

            public void beforeBulk(long l, org.elasticsearch.action.bulk.BulkRequest bulkRequest) {

                System.out.println("---尝试操作" + bulkRequest.numberOfActions() + "条数据---");

            }

            //TODO 第一个afterBulk会在批量成功后执行，可以跟beforeBulk配合计算批量所需时间

            public void afterBulk(long l, org.elasticsearch.action.bulk.BulkRequest bulkRequest, BulkResponse bulkResponse) {

                System.out.println("---尝试操作" + bulkRequest.numberOfActions() + "条数据成功---");

            }

            //TODO 第二个afterBulk会在批量失败后执行

            public void afterBulk(long l, org.elasticsearch.action.bulk.BulkRequest bulkRequest, Throwable throwable) {

                System.out.println("---尝试操作" + bulkRequest.numberOfActions() + "条数据失败---");

            }

        })

                // 1w次请求执行一次bulk

                .setBulkActions(10000)

                // 1gb的数据刷新一次bulk

                .setBulkSize(new ByteSizeValue(1, ByteSizeUnit.GB))

                // 固定5s必须刷新一次

                .setFlushInterval(TimeValue.timeValueSeconds(5))

                // 并发请求数量, 0不并发, 1并发允许执行

                .setConcurrentRequests(1)

                // 设置退避, 100ms后执行, 最大请求3次

                .setBackoffPolicy(

                        BackoffPolicy.exponentialBackoff(TimeValue.timeValueMillis(100), 3))

                .build();

        // 添加请求数据

        Map<String, Object> m = new HashMap<String, Object>();

        m.put("document", "这是异步批量插入测试");

        bulkProcessor.add(new IndexRequest("testblog", "test", "1").source(m));

        bulkProcessor.add(new IndexRequest("testblog", "test", "2").source(m));

bulkProcessor.flush();

//        bulkProcessor.add(new DeleteRequest("testblog", "test", "2"));

        // 关闭

        bulkProcessor.awaitClose(10, TimeUnit.MINUTES);

    }

es之java插入优化（批量插入）的更多相关文章

Java使用iBatis批量插入数据到Oracle数据库
Java使用iBatis批量插入数据到Oracle数据库因为我们的数据跨库(mysql,oracle),单独取数据的话需要遍历好多遍,所以就想着先从mysql数据库中取出来的数据然后在oracle数 ...
mybatis单个插入和批量插入的简单比较
在J2EE项目中,mybatis作为主流持久层框架,许多知识值得我们去钻研学习,今天,记录一下数据插入性能(单个插入和批量插入). 一,测试对象 public class Test { private ...
java读取文件批量插入记录
只是一个例子,方便以后查阅. import ey.db.oracle.OracleHelper; import ey.db.type.*; import java.io.BufferedReader; ...
Hibernate批处理操作优化 (批量插入、更新与删除)
问题描述我开发的网站加了个新功能:需要在线上处理表数据的批量合并和更新,昨天下午发布上线,执行该功能后,服务器的load突然增高,变化曲线异常,SA教育了我一番,让我尽快处理,将CPU负载降低. 工 ...
Mysql优化批量插入数据
最近为了测试项目,需要在Mysql中插入百万级测试数据,于是用到了批量插入,自己写了个简单的Spring Cloud项目. 开始时执行效率很慢,大概100条/秒,批次的大小也试过1000,2000,5 ...
mybatis的插入与批量插入的返回ID的原理
目录背景底层调用方法单个对象插入列表批量插入完成背景最近正在整理之前基于mybatis的半ORM框架.原本的框架底层类ORM操作是通过StringBuilder的append拼接的,这次 ...
24单行插入与批量插入-insert(必学)-天轰穿sqlserver视频教程
大纲:insert语句,简单插入数据与批量插入数据为了冲优酷的访问量,所以这里只放优酷的地址了,其实其他网站还是都传了的哈. 代码下载http://www.cnthc.com/?/article/1 ...
c# MongoDB插入和批量插入，插入原理
在开发之前,选择MongoDb驱动是件很重要的事情.如果选择不好,在后期的开发的是件很费力的事情,因为我就遇到这样的问题.MongoDb驱动有几种比较流行驱动,官方驱动和samus是两种使用比较多的. ...
java实现sql批量插入参数
背景: 需要更新一些不规范的时间格式,如将某个时间格式化为yy-MM-dd,实际上为 yy-MM-dd hh:mm:ss,并且需要提供回滚脚本. 例如:规范化时间的脚本如下: ,) WHERE tes ...
java改单个插入为批量插入
单条insert into table value() 13W数据需要执行7小时变成inert into table value(),(),(),(),() inert into table val ...

随机推荐

Linux hostname 主机名篇
主机名修改(以主机名为config为例) 1.修改文件/etc/sysconfig/network,内容为 [root@config ~]# cat /etc/sysconfig/network# C ...
Eureka 源码分析之 Eureka Server
文章首发于公众号<程序员果果> 地址 : https://mp.weixin.qq.com/s/FfJrAGQuHyVrsedtbr0Ihw 简介上一篇文章<Eureka 源码分析 ...
linux工具之screen
screen官方网址:http://www.gnu.org/software/screen/ 参考文章:http://man.linuxde.net/screen 简介 Screen是一款由GNU计划 ...
docker环境下分析zookeeper观察者角色
问题引入 zookeeper新引入的角色observer是不参与投票的,通过增加observer节点,可以在提高zk系统读吞吐量时,不影响写吞吐量. 那么问题来了 Zookeeper系统节点如果超过半 ...
Rest_Framework常用插件
1. 认证Authentication 可以在配置文件中配置全局默认的认证方案 REST_FRAMEWORK = { 'DEFAULT_AUTHENTICATION_CLASSES': ( 'rest ...
连连看（简单搜索）bfs
连连看Time Limit: 20000/10000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submis ...
application session 实现简单的在线聊天人数的统计
写了快一年的asp.net,application对象还真没怎么用过.看了看书,根据这两个对象的特性写了一个简单的聊天室程序.真的是非常的简陋 ASP.Net中有两个重要的对象,一个是applicat ...
k3 cloud的单据存储在业务对象表中
k3 cloud的单据存储在业务对象表中,表名为T_META_OBJECTTYPE,查询表名和对应的表: select FNAME,FBASEOBJECTID from T_META_OBJECTTY ...
gp指标信息
RSI: 相对强弱指数,RSI的原理简单来说是以数字计算的方法求出买卖双方的力量对比强弱指标理论认为,任何市价的大涨或大跌,均在0-100之间变动,根据常态分配认为RSI值多在30-70之间变动, ...
webpack 中如何使用 vue
1. 安装vue的包: cnpm i vue -S 2. 由于在 webpack 中,推荐使用 .vue 这个组件模板文件定义组件,所以,需要安装能解析这种文件的 loader cnpm i vu ...

es之java插入优化（批量插入）

1：普通的批量插入方式

2：优化后的批量执行方式

es之java插入优化（批量插入）的更多相关文章

随机推荐

热门专题