全文检索框架和搜索引擎的安装和配置:

  • 安装全文检索框架,pip install django-haystack,
  • 安装搜索引擎,pip install whoosh
  • settings里面配置
  • 1,注册haystack
  • INSTALLED_APPS=[
  • # 注册全文搜索框架
  • 'haystack',
  • ]
  • 2,配置,
    1. # 全文检索框架的配置
    2. HAYSTACK_CONNECTIONS = {
    3. 'default': {
    4. # 使用whoosh引擎
    5. # 'ENGINE': 'haystack.backends.whoosh_backend.WhooshEngine',
    6. 'ENGINE': 'haystack.backends.whoosh_cn_backend.WhooshEngine',
    7. # 索引文件路径
    8. 'PATH': os.path.join(BASE_DIR, 'whoosh_index'),
    9. }
    10. }
    11.  
    12. # 当添加、修改、删除数据时,自动生成索引
    13. HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'

    这是一个路径:

  • 我找到Linux下面的路径:
  • /home/andy/.virtualenvs/lq_py3/lib/python3.5/site-packages/haystack/backends
  • 然后把我Windows下面的文件移动到这个地方,
  • 这里面有jieba分词的代码,

生成索引文件:

  • 搜索的是商品表的数据,
  • 你要有索引文件的生成,最终是需要goossku这个类,新建一个这个类的一个索引类,
  • 在templates下面建立文件夹search,下面建立indexes,这两个文件名都是固定的,
  • 下面再建立goods文件夹,建立索引文件,
  • 现在就可以生成索引数据了,
  • >python manage.py rebuild_index

全文检索的应用:

  • 两个地方,
  • 1,是页面上搜索的地方要有一个提交搜索的目标路径,
  • 2,是后台路由需要配置这个路径,这个是交给haystack来处理的,
  • 还需要一个搜索结果页的html页面,

更改分词的方式:

  • 比如,很不错的草莓,
  • 但是你搜索不错,这是查不到的,
  • 所以默认whoosh里面的引擎,在分解词语的时候分词不好,有些词分的不好,
  • 我们要使用一个中文分词的包,就是jieba分词,这是中文默认的分词,比默认的要好,
  • 这个分词怎么用:
  • 第一步:安装
  • 安装,pip install jieba,
  • 有什么用?下面就是演示:
  • import jieba,
  • srt=‘很不错的草莓’
  • res=jieba.cut(str,cut_all=True)
  • for val in res:
  • print(val)

  • 不错

    草莓

  • 这就是分词的结果,很不错,
  • 那么怎么用呢?
  • 第二步:在haystack目录新建一个文件,
  • 还是进入Linux中,haystack的目录下:
  • /home/andy/.virtualenvs/lq_py3/lib/python3.5/site-packages/haystack/backends
  • 然后把Windows下面的文件ChineseAnalyzer.py复制一份到这个地方,
  • 然后就可以了,
  • 1,安装
  • 2,新建一个文件,
  • 3,修改文件,
  • 4,修改配置,
  • 5,重新建立索引,这次就是使用jieba分词了

python-django项目基础-haystack&whoosh&jieba_20191124的更多相关文章

  1. Python(Django)项目与Apache的管理

    (开开心心每一天~ ---虫瘾师) Python(Django)项目交给Apache的管理(一) 准备:Django的环境(Python).Apache.Wsgi(必须文件) 首先需要电脑有Pytho ...

  2. Python(Django)项目与Apache的管理交互

    (开开心心每一天~ ---虫瘾师) Python(Django)项目交给Apache的管理(一) 准备:Django的环境(Python).Apache.Wsgi(必须文件) 首先需要电脑有Pytho ...

  3. Python Django项目日志查询系统

    该项目适合中小型公司日志查询工作.大型公司可以使用elk等.该系统其实就是调用了absible命令去查日志,然后把输出的信息输到页面查看. 日志查询系统 维护手册 作者:陈土锋 日期:2020年6月1 ...

  4. 使用Nginx+uwsgi在亚马逊云服务器上部署python+django项目完整版(二)——部署配置及相关知识

    ---恢复内容开始--- 一.前提: 1.django项目文件已放置在云服务器上,配置好运行环境,可正常运行 2.云服务器可正常连接 二.相关知识 1.python manage.py runserv ...

  5. 小试VS 2017 开发Python Django项目过程一

    一.新建项目python ->django web 项目 (选择带bootstrap风格与twwriter)项目名称iepiececomputing (ie计件计算)跳出窗体 -> 添加虚 ...

  6. Python Django项目部署 Linux 服务器

    项目依赖: Linux Centos7 (阿里云轻量级服务器) + Python 3.7.2 + Django 2.2.1 + restframework 3.9.4 + mysql 5.7 1 安装 ...

  7. python - django 项目部署 Ubuntu 服务器后接口访问一直 502 问题

    问题描述:最近有了一台 Ubuntu 的服务器,然后准备部署个项目,结果没想到部署的过程跟用 Centos 的时候还有点不一样,最后一步我是卡在了 uwsgi 这里,访问一直502,且可以访问项目的静 ...

  8. python django项目创建及前期准备(使用pycharm)

    一.创建django项目 1.打开pycharm软件 2.点击菜单栏 File-->New Project,弹出如下对话框,如下图设置 二.基本配置 1.静态文件目录配置(用于客户端访问后台服务 ...

  9. Django项目基础配置和基本使用

    博文配置内容包括: django项目的创建 django项目下应用的创建及配置 数据库的配置 templates模板的配置 命令行创建项目: 在需要的目录下创建Django项目输入命令:django- ...

随机推荐

  1. 题解 P1317 【低洼地】

    题目 这题挺简单的,没必要用数组 [分析] 需要判断的是低洼地的数量 通过对题目中图进行分析,显然可以发现低洼地的定义: 若数组中存在一个数值相同的连续区间,这个区间端点外相邻两点的数值都大于该区间的 ...

  2. ftp限制

    /etc/hosts.deny /etc/vsftpd/user_list 从2.3.5之后,vsftpd增强了安全检查,如果用户被限定在了其主目录下,则该用户的主目录不能再具有写权限了!如果检查发现 ...

  3. [极客大挑战 2019]Havefun

    打开题目右键查看源代码 <!--$cat=$_GET['cat']; echo $cat; if($cat=='dog') {echo 'Syc{cat_cat_cat_cat}';}--> ...

  4. DDL&DML

    SQL语言的DDL和DML DDL:数据定义语言它是用来定义 管理数据对象(数据库和数据表)的. create(创建),alter(修改),drop(删除) 一.创建数据库create datebas ...

  5. Python说文解字_杂谈04

    1. 鸭子类型: 当你看到一只鸟走来像鸭子,游泳起来像鸭子,叫起来也像鸭子,他么他就可以叫做鸭子.任何可迭代的对象.一样的方法,可以用可迭代的话,就可以迭代的组合打印.__getitem__可以塞到任 ...

  6. share团队冲刺5

    团队冲刺第五天 昨天:按钮操作,自定义按钮及各种原件样式 今天:设置按钮按下效果,界面布局 问题:无

  7. linux系统终端介绍

    https://zhidao.baidu.com/question/174261014.html

  8. 正确返回Unicode码点大于0xFFFF的字符串长度

    如下: function codePointLength(text){ var result = text.match(/[\s\S]/gu); return result? result.lengt ...

  9. 2019CSP-J游记

    2019-10-19:开一个坑,今天初赛,我是我们考场唯一几个坚持到16:45收卷的人,我们是机试,竟然可以用编译器. 这次初赛总体感觉打得不错,卷面满分200,最后实际分数,就是卷面分除以二. 初赛 ...

  10. 添加头文件的报错failed to emit precompiled header 的解决办法

    在buildsetting中的以下两个路径中添加对应的设置,重现编译即可解决,stackoverflow地址:点击 Solution:1 I added $(inherited) non-recurs ...