本文首发于公众号:Hunter后端

原文链接:Python连接es笔记一之连接与查询es

有几种方式在 Python 中配置与 es 的连接,最简单最有用的方法就是定义一个默认的连接,如果系统不是需要访问多个集群,最建议的方式就是使用 create_connection 方法创建连接,然后所有的操作都会自动使用这个连接。

以下是本篇笔记目录:

  1. 安装依赖
  2. 连接
  3. Search 查询
  4. Response 返回结果详解

1、安装依赖

我们使用的依赖名称为 elasticsearch_dsl,我们这里使用的 es 版本是 7.2.0,所以安装方式如下:

  1. pip3 install elasticsearch_dsl==7.2.0

2、连接

默认连接方式

我们可以通过下面的方式来连接 es:

  1. from elasticsearch_dsl import connections
  2. connections.create_connection(hosts=["localhost"], timeout=20)

或者我们也可以加一个 alias,用作连接的别名,在后面可以很方便的用上:

  1. from elasticsearch_dsl import connections
  2. connections.create_connection(alias="new_conn", hosts=["localhost"], timeout=20)

多集群连接

如果我们想同时连接多个集群,可以使用 configure 方法:

  1. connections.configure(
  2. default={"hosts": "localhost"},
  3. dev={
  4. "hosts": ["example.com:9200"],
  5. "sniff_on_start": True,
  6. }
  7. )

使用别名

当使用多个连接的时候,我们可以使用别名,也就是前面的 alias 参数来指代连接:

  1. s = Search(using="default")

3、Search 查询

接下来介绍下如何在 Python 中查询 es 数据。

注意下,当我们安装 elasticsearch_dsl 依赖的时候,系统会自动为我们安装 elasticsearch 模块,我们可以直接引用。

我们默认前面已经设置好了全局的 es 连接,之后的操作都基于这个连接:

  1. from elasticsearch_dsl import connections
  2. connections.configure(
  3. default={"hosts": "localhost:9200"},
  4. )

我们来执行一下查询和打印操作:

  1. response = Search(using="default").query("match", name="张三丰").execute()
  2. print(response)

可以看到 response 就打印出了我们在之前往 es 的 exam 这个 index 中写入的数据:

  1. <Response: [<Hit(exam/16): {'name': '张三丰', 'address': '一个苹果'}>]>

我们先来介绍下执行查询的操作。

链式操作

这个查询的 API 是链式操作,可以允许你链接多个操作,比如我们前面的 Search() 后直接跟了 query() 方法,然后直接 execute()。

我们分开执行也是可以的:

  1. s = Search(using="default")
  2. s = s.query("match", name="张三丰")
  3. response = s.execute()

指定 index

在上面的 Search() 方法里,我们通过 using 指定了连接,但是没有指定 index,那么就默认搜索的是该连接的全部 index,我们可以通过 index() 函数指定 index,也可以向 Search() 中添加 index 参数来指定 index。

  1. s = Search(using="default", index="exam").query("match", name="张三丰")
  2. response = s.execute()
  3. s = Search(using="default").index("exam").query("match", name="张三丰")
  4. response = s.execute()

转换 es 查询语句

如果我们想要查看执行的语句转换成的 es 的语句,可以使用 to_dict() 方法:

  1. s = Search(using="default", index="exam").query("match", name="张三丰")
  2. print(s.to_dict())
  3. # {'query': {'match': {'name': '张三丰'}}}

删除语句

前面介绍了 s = Search().query() 的 execute() 是执行,获取返回结果,to_dict() 是转换成 es 语句,如果是需要删除查询的数据,可以如下操作:

  1. s = Search(using="default").index("exam").query("match", name="张三丰")
  2. s.delete()

4、Response 返回结果详解

为了详细查看 response 中的详细情况,我们可以在 Python 的 shell 中挨个执行下面的命令,获得 response 对象,然后再操作 response,当然,前面记得创建 es 的连接:

  1. >>> s = Search(using="default").index("exam").query("match", name="张三丰")
  2. >>> response = s.execute()

对于 response,本身我们可以使用 Python 中的列表的形式来访问它,来获取它的数据,比如执行 print(response[0]) 可以看到这条数据本身的信息:

  1. >>> print(response[1])
  2. # <Hit(exam/24): {'name': '张三丰', 'address': '中国湖北省', 'age': 22}>

如果我们查看 type(response) 可以发现它来源于 <class 'elasticsearch_dsl.response.Response'> 定义了一个 iter() 方法,所以我们可以对这个对象使用迭代方法。

在这个方法内部它迭代的其实是 response.hits 属性,也就是我们 es 查询返回的数据。

所以我们执行 response[0] 和 response.hits[0] 是等效操作。

获取总数

因为我们上面的查询操作没有设置 size,所以默认最多返回的是 10 条数据,但如果我们想要获取符合我们查询条件的总数,我们可以这样获取:

  1. count = response.hits.total.value

单条数据详情

上面介绍了我们可以通过 response[0] 获得单条数据,对于单条数据,我们还可以获取更多的详情信息。

  1. hit = response.hits[0]

如果我们想一次性获取返回的数据的各个字段及相应的值,我们可以使用 to_dict() 方法:

  1. hit.to_dict()
  2. # {'name': '张三丰', 'address': '中国', 'age': 21}

获取单个值,比如 name,也可以直接:

  1. print(hit.name)

也可以获取数据的 meta 信息,其中包含了这条数据所在的 index,id,匹配分值 score 等:

  1. hit.meta
  2. # {'index': 'exam', 'id': '23', 'score': 0.4700036, 'doc_type'...}

如果想获取更多后端相关文章,可扫码关注阅读:

Python连接es笔记一之连接与查询es的更多相关文章

  1. 白日梦的ES笔记三:万字长文 Elasticsearch基础概念统一扫盲

    目录 一.导读 二.彩蛋福利:账号借用 三.ES的Index.Shard及扩容机制 四.ES支持的核心数据类型 4.1.数字类型 4.2.日期类型 4.3.boolean类型 4.4.二进制类型 4. ...

  2. python中的MySQL数据库操作 连接 插入 查询 更新 操作

    MySQL数据库 就数据库而言,连接之后就要对其操作.但是,目前那个名字叫做qiwsirtest的数据仅仅是空架子,没有什么可操作的,要操作它,就必须在里面建立“表”,什么是数据库的表呢?下面摘抄自维 ...

  3. python socket 编程之三:长连接、短连接以及心跳

    长连接:开启一个socket连接,收发完数据后,不立刻关闭连接,可以多次收发数据包. 短连接:开启一个socket连接,收发完数据后,立刻关闭连接. 心跳:长连接在没有数据通信时,定时发送数据包(心跳 ...

  4. python socket 编程之三:长连接、短连接以及心跳(转药师Aric的文章)

    长连接:开启一个socket连接,收发完数据后,不立刻关闭连接,可以多次收发数据包. 短连接:开启一个socket连接,收发完数据后,立刻关闭连接. 心跳:长连接在没有数据通信时,定时发送数据包(心跳 ...

  5. CNN学习笔记:全连接层

    CNN学习笔记:全连接层 全连接层 全连接层在整个网络卷积神经网络中起到“分类器”的作用.如果说卷积层.池化层和激活函数等操作是将原始数据映射到隐层特征空间的话,全连接层则起到将学到的特征表示映射到样 ...

  6. 关于python语言使用redis时,连接是否需要关闭的问题

    python操作完redis,需要关闭连接的吧,怎么关闭呢 1人赞 回复 君惜丶: redis-server会关闭空闲超时的连接redis.conf中可以设置超时时间:timeout 300 2017 ...

  7. Python 使用 PyMysql、DBUtils 创建连接池,提升性能

    转自:https://blog.csdn.net/weixin_41287692/article/details/83413775 Python 编程中可以使用 PyMysql 进行数据库的连接及诸如 ...

  8. python通过socket实现多个连接并实现ssh功能详解

    python通过socket实现多个连接并实现ssh功能详解 一.前言 上一篇中我们已经知道了客户端通过socket来连接服务端,进行了一次数据传输,那如何实现客户端多次发生数据?而服务端接受多个客户 ...

  9. 用python调试Appium和雷电模拟器连接时出现Original error: Could not find 'adb.exe' in PATH

    用python调试Appium和雷电模拟器连接时出现Original error: Could not find 'adb.exe' in PATH 确定环境变量没错,用管理员启动Appium就不会出 ...

  10. python操作 linux连接wifi,查看wifi连接状态方法

    Python连接Ubuntu 环境 wifi流程   1.获取网络接口列表 通过wifi_net.py 的query_net_cards方法获取终端物理网络接口列表及IP信息: 获取物理网络接口列表: ...

随机推荐

  1. .Net7 CLR的调用函数和编译函数

    前言 .Net运行模型,无非就两个过程.一个是调用入口函数,另外一个就是编译入口函数.前者主调用,后者主编译. 概括 一:入口函数:RunMainInternal 所有的.Net程序,包括控制台,We ...

  2. IO 与 NIO之网络通信

    一.阻塞IO / 非阻塞NIO 阻塞IO:当一条线程执行 read() 或者 write() 方法时,这条线程会一直阻塞直到读取到了一些数据或者要写出去的数据已经全部写出,在这期间这条线程不能做任何其 ...

  3. ApplicationRunner 类说明

    在开发中可能会有这样的情景.需要在容器启动的时候执行一些内容.比如读取配置文件,数据库连接之类的.SpringBoot给我们提供了两个接口来帮助我们实现这种需求.这两个接口分别为 CommandLin ...

  4. 罗技GHUB怎么写入板载内存

    本文以自用罗技MX518复刻版鼠标作为例子,让大家怎么学会把logitech G HUB的设置写入鼠标板载内存,并且一键切换各组板载设置. 首先点击最下方的启用,让软件设置鼠标各项设定 启用软件的设定 ...

  5. OpenAI Kubernetes 相关博文读后笔记

    一.概述 最近 ChatGPT 和其公司 OpenAI 特别火:ChatGPT 3, ChatGPT 3.5, New Bing, ChatGPT 4... 怀着学习的心态,这几天访问了 OpenAI ...

  6. 数据文件的读写—R实现

    数据文件的读写 在R语言中可以读写的最基本的数据格式就是text,以及csv文件.用read.table()或者read.csv函数就可以,相应的写入函数是write.table(),write.cs ...

  7. pandas之reindex重置索引

    重置索引(reindex)可以更改原 DataFrame 的行标签或列标签,并使更改后的行.列标签与 DataFrame 中的数据逐一匹配.通过重置索引操作,您可以完成对现有数据的重新排序.如果重置的 ...

  8. pysimplegui之调试输出(easy_print = Print = eprint)

    "Easy" API 系列中的另一个调用是EasyPrint. 与其他常用的 PySimpleGUI 调用一样,同一个调用还有其他名称.您可以使用Print或eprint除了Eas ...

  9. [数据库]Oracle数据迁移至HIVE(待续)

    step1 导出csv数据,并 call sql_to_csv('select * from BE_JJZKJCQKTJ', 'OUT_PATH', 'DA.BE_JJZKJCQKTJ.csv'); ...

  10. Unity学习笔记01 —— 编辑器

    场景Scene 基本操作 按下鼠标滚轮拖动场景,滑动滚轮缩放场景. 鼠标右键旋转场景,点击""后,通过左键移动场景. 点击右键同时按下W/S/A/D/Q/E键可实现场景漫游. 在S ...