首先django实现全文检索在这里使用的是haystack,环境是django2.1+win10 64+py3.7

1: 安装包:

  1. pip install dgango-haystack #安装全局检索框架
  2. pip install jieba
  3. pip install whoosh
  4. #没有指明版本号的默认安装最新版

2: 在项目的根目录下的setting.py中配置haystack

首先在安装的app中添加haystack

在setting.py文件的最后进行haystack的配置,配置如下:

  1. # 全文检索
  2. HAYSTACK_CONNECTIONS = {
  3. 'default': {
  4. #你的应用名+whoosh_backend.Whooshengine, whoosh_backend后边我们会说到
  5. 'ENGINE': 'df_goods.whoosh_backend.WhooshEngine',
  6. # 使用whoosh引擎
  7. # 索引文件路径
  8. 'PATH': os.path.join(BASE_DIR,'whoosh_index'),
  9. }
  10. }
  11. # 指定每页显示的结果数量
  12. HAYSTACK_SEARCH_RESULTS_PER_PAGE = 10
  13. HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor' # 索引自动更新
  14. # HAYSTACK_DEFAULT_OPERATOR = 'OR'
  15. # 当修改,添加,删除数据时,索引会自动更新

3:我们搜索应用是df_goods,所以在df_goods路径下,需要创建两个haystack需要文件,search_indexes.py 和whoosh_cn_backend.py(这两个文件名不能变!!不能变!)

  1. #df_goods_indexes.py:
  2. from .models import GoodsInfo
  3. from haystack import indexes
  4. class GoodsInfoIndex(indexes.SearchIndex,indexes.Indexable):
  5. text = indexes.CharField(document=True,use_template=True)#有且只能有一个document=True
  6. #对标题,简介,内容进行搜索
  7. gtitle= indexes.CharField(model_attr='gtitle')
  8. gjianjie = indexes.CharField(model_attr='gjianjie')
  9. gcontent = indexes.CharField(model_attr='gcontent')
  10. def get_model(self):
  11. return GoodsInfo
  12. def index_queryset(self, using=None):
  13. return self.get_model().objects.all()
  14. #每个索引里面必须有且只能有一个字段document=True

4:在templates目录下新建search文件夹,在search文件夹下新建indexes目录,早indexes目录下新建你的应用名(这里是df_goods),在应用名目录下新建对应models.py中的类名(这里是goodsinfo)_text.txt,这里是goodsinfo_text.txt,

在txt文件中添加如下代码:

  1. {{object.gtitle}}
  2. {{object.gjianjie}}
  3. {{object.gcontent}}
  4. ‘’‘
  5. 格式是:{{object.你模型类中对应类中的属性}} #这里的是df_goods应用下的models中的goodsinfo类下的属性
  6. ’‘’

这个文件吧gtitle,gjinajie,gcontent指定为索引字段。

5:whoosh_backend.py文件在你的python安装目录下的libs下的site-packages下去找:比如我的是:D:\Python\install\Lib\site-packages\haystack\backends,

直接把它复制到你app(在这是df_goods)的目录下,之后我们对whoosh_backend.py进行修改,大概在165行附近;

  1. from jieba.analyse import ChineseAnalyzer
  2. #修改前:
  3. schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=StemmingAnalyzer(), field_boost=field_class.boost, sortable=True)

  4. #修改后
  5. schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=ChineseAnalyzer(), field_boost=field_class.boost, sortable=True)

6:在项目的url中配置haystack,也就是项目最开始的那个url,配置如下:

  1. #记得一定要注意django中的path与re_path
  2. re_path(r'^search/',include('haystack.urls')),

7:      之后我们在新建的templates下的search文件夹下新建search.html,  名字最好不要变!!


  1. <!DOCTYPE html>
  2. <html>
  3. <head>
  4. <title></title>
  5. </head>
  6. <body>
  7. {% if query %}
  8. <h3>搜索结果如下:</h3>
  9. {% for result in page.object_list %}
  10. <a href="/{{ result.object.id }}/">{{ result.object.gName }}</a><br/>
  11. {% empty %}
  12. <p>啥也没找到</p>
  13. {% endfor %}
  14. {% if page.has_previous or page.has_next %}
  15. <div>
  16. {% if page.has_previous %}<a href="?q={{ query }}&page={{ page.previous_page_number }}">{% endif %}« 上一页{% if page.has_previous %}</a>{% endif %}
  17. |
  18. {% if page.has_next %}<a href="?q={{ query }}&page={{ page.next_page_number }}">{% endif %}下一页 »{% if page.has_next %}</a>{% endif %}
  19. </div>
  20. {% endif %}
  21. {% endif %}
  22. </body>
  23. </html>

8:生成索引:

  1. python manage.py rebuild_index或者 python manage.py update_index

9: 运行服务器 127.0.0.1/search就可以全文检索了!

django2.1实现全文检索(最详细)+遇到的坑+jieba分词的更多相关文章

  1. 稍微记录下Django2.2使用MariaDB和MySQL遇到的坑

    现在演示一下整个流程吧 1.创建项目和应用 PS:你也可以使用PyCharm直接创建项目 2.注册应用 先把刚刚创建的应用添加进去 3.配置MySQL或者MariaDB 4.PyMySQL替换默认的M ...

  2. 超详细:Python(wordcloud+jieba)生成中文词云图

    # coding: utf-8 import jieba from scipy.misc import imread # 这是一个处理图像的函数 from wordcloud import WordC ...

  3. 使用IDEA工具配置和运行vue项目(详细其中的坑)

    刚来公司实习发现公司的前端使用的是vue,之前根本就没有听说过.然后一上来就需要看代码,but but 就是没有文档什么的东西, 就需要自己去研读,我就想去运行其中的前端和后端联调起来方便理解,结果在 ...

  4. Django中使用haystack进行全文检索时需要注意的坑

    对于haystack的配置什么的我在这里就不必说什么了,毕竟一搜一大把. 直接说重点 1 当你通过继承haystack的views来自定义django 应用的views 时,你要注意heystack ...

  5. (转)全文检索技术学习(三)——Lucene支持中文分词

    http://blog.csdn.net/yerenyuan_pku/article/details/72591778 分析器(Analyzer)的执行过程 如下图是语汇单元的生成过程:  从一个Re ...

  6. django-haystack全文检索详细教程

    前几天要用Django-haystack来实现搜索功能,网上一搜中文资源少之又少,虽说有官方文档,但相信对于我们这些英语差的同学来说要看懂真的是一件难事.特别是关于高级部分,特地找了个英语专业的来翻译 ...

  7. Django:haystack全文检索详细教程

    参考:https://blog.csdn.net/AC_hell/article/details/52875927 一.安装第三方库及配置 1.1 安装插件 pip install whoosh dj ...

  8. PostgreSQL全文检索zhparser使用

    本文引用自: http://blog.chinaunix.net/uid-20726500-id-4820580.html 防止文章丢失才进行复制 PostgreSQL支持全文检索,其内置的缺省的分词 ...

  9. 使用Lucene.Net实现全文检索

    使用Lucene.Net实现全文检索 目录 一 Lucene.Net概述 二 分词 三 索引 四 搜索 五 实践中的问题 一 Lucene.Net概述 Lucene.Net是一个C#开发的开源全文索引 ...

随机推荐

  1. 屌炸天,像写代码一样写PPT,一个小工具解决

    此文已经废,请移步升级版博文: markdown写ppt (史上最全)

  2. 2020想进大厂你不得不了解的MySQL意外事件的查询技巧

    导读:数据库是导致应用系统运行缓慢的常见原因.面对数据库引性能问题,很多开发者或者DBA却束手无策.本文作者经过多年的实际经验,整理了一些材料,将Linux环境下MySQL性能突发事件问题排查技巧分享 ...

  3. 温故而知新--day5

    温故而知新--day5 ip地址 IP是英文Internet Protocol的缩写,意思是"网络之间互连的协议",也就是为计算机网络相互连接进行通信而设计的协议.当多个设备要进行 ...

  4. SpringBoot实战:10分钟快速搞定环境

    什么是 springboot Spring Boot是由Pivotal团队提供的全新框架,其设计目的是用来简化新Spring应用的初始搭建以及开发过程. 该框架使用了特定的方式来进行配置,从而使开发人 ...

  5. 整合Spring Cloud Stream Binder与GCP Pubsub进行消息发送与接收

    我最新最全的文章都在南瓜慢说 www.pkslow.com,欢迎大家来喝茶! 1 前言 之前的文章<整合Spring Cloud Stream Binder与RabbitMQ进行消息发送与接收& ...

  6. jenkins 修改端口后无法启动的解决思路

    一.问题 jenkins网站绑定域名后直接通过域名访问使用的是8080端口,为方便用户访问因此须监听80端口,而为了安全起见linux一般不用root身份运行,综上,需要以普通用户来运行监听80端口时 ...

  7. 基于Yarp实现内网http穿透

    Yarp介绍 YARP是微软开源的用来代理服务器的反向代理组件,可实现的功能类似于nginx. 基于YARP,开发者可以非常快速的开发一个性能不错的小nginx,用于代理http(s)请求到上游的ht ...

  8. Redis 实战篇:GEO助我邂逅附近女神

    码老湿,阅读了你的巧用数据类型实现亿级数据统计之后,我学会了如何游刃有余的使用不同的数据类型(String.Hash.List.Set.Sorted Set.HyperLogLog.Bitmap)去解 ...

  9. AcWing 1273. 天才的记忆

    从前有个人名叫 WNB,他有着天才般的记忆力,他珍藏了许多许多的宝藏. 在他离世之后留给后人一个难题(专门考验记忆力的啊!),如果谁能轻松回答出这个问题,便可以继承他的宝藏. 题目是这样的:给你一大串 ...

  10. Springboot:SpringBoot2.0整合WebSocket,实现后端数据实时推送!

    一.什么是WebSocket? B/S结构的软件项目中有时客户端需要实时的获得服务器消息,但默认HTTP协议只支持请求响应模式,这样做可以简化Web服务器,减少服务器的负担,加快响应速度,因为服务器不 ...