search(6)- elastic4s-CRUD
如果我们把ES作为某种数据库来使用的话,必须熟练掌握ES的CRUD操作。在这之前先更正一下上篇中关于检查索引是否存在的方法:elastic4s的具体调用如下:
//删除索引
val rspExists = client.execute(indexExists("company")).await
if (rspExists.result.exists)
client.execute(deleteIndex("company")).await
在下面我们还会示范如何检查一条记录(document)是否存在的方法。
先示范新建一条记录。一般来讲数据库表都有个唯一字段,最好用ES里的id来代表,否则ES会自动产生一个唯一id,那么随机读取get时就会很不方便。如果新插入的记录id已经在表里存在,ES会替换新的内容,不会产生异常。可以在elastic4s里使用createOnly(true)来强制产生重复id异常:
import com.sksamuel.elastic4s.{ElasticClient, ElasticProperties}
import com.sksamuel.elastic4s.akka._
import akka.actor._ import scala.concurrent.ExecutionContext.Implicits.global
object Lesson05 extends App {
import com.sksamuel.elastic4s.ElasticDsl._ private implicit lazy val system: ActorSystem = ActorSystem()
val akkaClient = AkkaHttpClient(AkkaHttpClientSettings(List("130.1.1.234:9200")))
val client = ElasticClient(akkaClient) val publisher = indexInto("company").id("c00001")
.fields(
"code" -> "c00001",
"name" -> "人民出版社",
"biztype" -> "出版社",
"addr" -> Map(
"district" -> "北京市东城区",
"address" -> "朝阳门内大街166号"
),
"regdate" -> "1963-02-18",
"contact" -> "65122634@163.com"
).createOnly(true) val pubExists = client.execute(exists("company","c00001")).await
if (pubExists.isSuccess) {
val createPub = client.execute(publisher).await if (createPub.isSuccess) {
val pub = client.execute(get("company", "c00001").fetchSourceContext(true)).await
println(s"${pub.result.sourceAsMap}")
} else println(s"${createPub.error.reason}")
} else println(s"${pubExists.error.reason}") val dstributor = indexInto("company").id("c00002")
.fields(
"code" -> "c00002",
"name" -> "新华文轩出版传媒股份有限公司",
"biztype" -> "出版发行",
"addr" -> Map(
"district" -> "四川省成都市锦江区",
"address" -> "金石路239号4栋1层1号"
),
"regdate" -> "2005-03-09",
"contact" -> "52635286@qq.com"
).createOnly(true) val grpExists = client.execute(exists("company","c00002")).await
if (grpExists.isSuccess) {
val createGroup = client.execute(dstributor).await if (createGroup.isSuccess) {
val dstr = client.execute(get("company", "c00002").fetchSourceContext(true)).await
println(s"${dstr.result.sourceAsMap}")
} else println(s"${createGroup.error.reason}")
} else println(s"${grpExists.error.reason}") val mget = client.execute(multiget(
get("company","c00001"),
get("company","c00002")
)).await
if(mget.isSuccess)
mget.result.items.foreach(i => println(s"${i.sourceAsMap}"))
else println(s"${mget.error.reason}") scala.io.StdIn.readLine()
system.terminate()
client.close()
}
上面示范了不同类型字段的填写方式,特别是nested字段如addr。每插入一条新记录就用get进行一次验证,输出显示:
HashMap(name -> 人民出版社, regdate -> --, contact -> @.com, code -> c00001, addr -> Map(district -> 北京市东城区, address -> 朝阳门内大街166号), biztype -> 出版社)
HashMap(name -> 新华文轩出版传媒股份有限公司, regdate -> --, contact -> @qq.com, code -> c00002, addr -> Map(district -> 四川省成都市锦江区, address -> 金石路239号4栋1层1号), biztype -> 出版发行)
HashMap(name -> 人民出版社, regdate -> --, contact -> @.com, code -> c00001, addr -> Map(district -> 北京市东城区, address -> 朝阳门内大街166号), biztype -> 出版社)
HashMap(name -> 新华文轩出版传媒股份有限公司, regdate -> --, contact -> @qq.com, code -> c00002, addr -> Map(district -> 四川省成都市锦江区, address -> 金石路239号4栋1层1号), biztype -> 出版发行)
上面提到过,如果我们想把ES当作普通的数据库来使用的话,还是要备齐了CRUD功能。具体操作按照关系数据库方式围绕着唯一键id进行。比如,我们可以用id来检查记录是否已经存在:
val pubExists = client.execute(exists("company","c00001")).await
if (pubExists.isSuccess) {...}
上面我们示范了针对索引的create,read操作。下面讨论一下update:update 可分单笔或批次两类,分别为:updateById, updateByQuery,很明显:updateByQuery是以query作为目标筛选条件的成批update操作。与上面的create操作一样,我们还是需要考虑唯一键id,这个可以在updateById操作里处理:当目标id存在时,用update请求里的字段值更新对应的字段。如目标id不存在的话就把update请求里的字段值当作新记录内容插入:
import com.sksamuel.elastic4s.http.JavaClient
import com.sksamuel.elastic4s.requests.common.RefreshPolicy
import com.sksamuel.elastic4s.{ElasticClient, ElasticProperties}
import scala.concurrent.ExecutionContext.Implicits.global
object Lesson06 extends App {
import com.sksamuel.elastic4s.ElasticDsl._ val esjava = JavaClient(ElasticProperties("http://localhost:9200"))
val client = ElasticClient(esjava) val doc1 = updateById("company","t00001")
.docAsUpsert(
Map(
"code" -> "t00001",
"name" -> "test company1"
)
) val doc2 = updateById("company","t00002")
.docAsUpsert(
Map(
"code" -> "t00002",
"name" -> "test company2"
)
) val doc3 = updateById("company","t00003")
.docAsUpsert(
Map(
"code" -> "t00003",
"name" -> "test company3"
)
) val updateAll = for {
_ <- client.execute(doc1)
_ <- client.execute(doc2)
_ <- client.execute(doc3)
} yield()
updateAll.await val getResults = client.execute(multiget(
get("company","t00001").fetchSourceInclude("code","name"),
get("company","t00002").fetchSourceInclude("code","name"),
get("company","t00003").fetchSourceInclude("code","name")
)
).await getResults.result.items.foreach(i => println(i.sourceAsMap)) client.close()
}
成批更新比较麻烦,因为通常每条记录的更新都可能涉及到当前记录的字段值,或作为判断条件,或为更新值,我们需要使用并处理当前记录中某些字段。这就需要在数据层面运行某些计算方法,可以用脚本语言来实现这样的功能,如下:
import com.sksamuel.elastic4s.requests.script.Script
val script = "ctx._source.fullname = ctx._source.code+' '+ctx._source.name"
val updateByQ = updateIn("company")
.query(matchQuery("name","test"))
.script(Script(script,Some("painless"))) val qupResult = client.execute(updateByQ).await val getResults = client.execute(multiget(
get("company","t00001"),
get("company","t00002"),
get("company","t00003")
)
).await getResults.result.items.foreach(i => println(i.sourceAsMap))
与update一样,delete也分单个或成批删除模式。delete by Id 示例如下:
(for {
_ <- client.execute(delete("t00001").from("company"))
_ <- client.execute(deleteByQuery("company", "t00002"))
} yield()).await
delete by Query 用法如下:
import com.sksamuel.elastic4s.Index._
client.execute(
deleteByQuery(toIndex("company"),
termQuery("code","t00003"))
).await
search(6)- elastic4s-CRUD的更多相关文章
- search(9)- elastic4s logback-appender
前面写了个cassandra-appender,一个基于cassandra的logback插件.正是cassandra的分布式数据库属性才合适作为akka-cluster-sharding分布式应用的 ...
- 【CF528D】Fuzzy Search(FFT)
[CF528D]Fuzzy Search(FFT) 题面 给定两个只含有\(A,T,G,C\)的\(DNA\)序列 定义一个字符\(c\)可以被匹配为:它对齐的字符,在距离\(K\)以内,存在一个字符 ...
- search(0)- 企业搜索,写在前面
计划研究一下搜索search,然后写个学习过程系列博客.开动之前先说说学习搜索的目的:不是想开发个什么搜索引擎,而是想用现成的搜索引擎在传统信息系统中引进搜索的概念和方法.对我来说,传统的管理系统le ...
- search(16)- elastic4s-内嵌文件:nested and join
从SQL领域来的用户,对于ES的文件关系维护方式会感到很不习惯.毕竟,ES是分布式数据库只能高效处理独个扁平类型文件,无法支持关系式数据库那样的文件拼接.但是,任何数据库应用都无法避免树型文件关系,因 ...
- Hibernate征途(三)之CRUD
上篇博客<Hibernate征途(二)之基础与核心>介绍了Hibernate的基础内容和核心内容,这篇博客简单实践一下.第一篇博客也说过Hibernate是一种JDBC的简化方案,既然是和 ...
- 【阅读笔记】Ranking Relevance in Yahoo Search (一)—— introduction & background
ABSTRACT: 此文在相关性方面介绍三项关键技术:ranking functions, semantic matching features, query rewriting: 此文内容基于拥有百 ...
- search(11)- elastic4s-模糊查询
很多时候搜索用户对查询语句具有模糊感觉,他们只能提供大约的描述.比如一个语句的部分,或者字句顺序颠倒等.通过模糊查询可以帮助用户更准确的找出他们希望搜索的结果. 模糊查询包括前后缀,语句(phrase ...
- search(12)- elastic4s-聚合=桶+度量
这篇我们介绍一下ES的聚合功能(aggregation).聚合是把索引数据可视化处理成可读有用数据的主要工具.聚合由bucket桶和metrics度量两部分组成. 所谓bucket就是SQL的GROU ...
- 关于mysql,需要掌握的基础(一):CRUD、存储引擎、单表查询相关、多表查询join、事务并发、权限管理等等
目录 关于mysql,需要掌握的基础(一): 1.了解数据库sql.数据库系统.数据库管理系统的概念. 2.了解DDL.DML.DQL语句是什么? 3.了解存储引擎.存储引擎[InnoDB 和 MyI ...
随机推荐
- Android应用开发基本流程
Android应用开发流程 应用规划及架构设计 开发应用程序的步骤 项目有哪些功能. 需要哪些必要的界面及界面之间跳转的流程. 需要的数据及其数据的来源和格式. 是否需要服务器端的支持. 是否需要本地 ...
- 「SWTR-04」Sweet Round 04 游记
比赛链接 由于 \(\texttt{Sweet Round}\) 比赛挺好的(关键不知道为啥\(Unrated\) 开篇总结(大雾):这次比赛题目不错(有思维含量) 尽管我不会做. 我一看 \(T1\ ...
- java物流查询接口测试代码-快递100
测试代码 返回json格式,xml/html格式自行修改参数 import java.io.IOException; import java.io.InputStream; import java.n ...
- Redis总结--【持续更新】
# 什么是Redis? Redis 是完全开源免费的,是一个高性能的key-value内存数据库,读的速度是110000次/s,写的速度是81000次/s 它有以下三个特点: Redis不 ...
- OpenCV-Python 图像的几何变换 | 十四
目标 学习将不同的几何变换应用到图像上,如平移.旋转.仿射变换等. 你会看到这些函数: cv.getPerspectiveTransform 变换 OpenCV提供了两个转换函数cv.warpAffi ...
- PyTorch专栏开篇
目前研究人员正在使用的深度学习框架不尽相同,有 TensorFlow .PyTorch.Keras等.这些深度学习框架被应用于计算机视觉.语音识别.自然语言处理与生物信息学等领域,并获取了极好的效果. ...
- 高并发解决方案限流技术-----使用RateLimiter实现令牌桶限流
1,RateLimiter是guava提供的基于令牌桶算法的实现类,可以非常简单的完成限流特技,并且根据系统的实际情况来调整生成token的速率.通常可应用于抢购限流防止冲垮系统:限制某接口.服务单位 ...
- 看完这篇 Session、Cookie、Token,和面试官扯皮就没问题了
Cookie 和 Session HTTP 协议是一种无状态协议,即每次服务端接收到客户端的请求时,都是一个全新的请求,服务器并不知道客户端的历史请求记录:Session 和 Cookie 的主要目的 ...
- 通过pip控制台查看已安装第三方库版本及最新版本
首先执行[pip --help]查看pip命令: 由Commands知:[pip list]命令查看已安装第三方库,另[pip list --outdated]可查看有新版本的第三方库.
- 人工智能新手入门学习路线和学习资源合集(含AI综述/python/机器学习/深度学习/tensorflow)
[说在前面]本人博客新手一枚,象牙塔的老白,职业场的小白.以下内容仅为个人见解,欢迎批评指正,不喜勿喷![握手][握手] 1. 分享个人对于人工智能领域的算法综述:如果你想开始学习算法,不妨先了解人工 ...