python-django项目基础-haystack&whoosh&jieba_20191124
全文检索框架和搜索引擎的安装和配置:
- 安装全文检索框架,pip install django-haystack,
- 安装搜索引擎,pip install whoosh
- settings里面配置
- 1,注册haystack
- INSTALLED_APPS=[
- # 注册全文搜索框架
- 'haystack',
- ]
- 2,配置,
# 全文检索框架的配置
HAYSTACK_CONNECTIONS = {
'default': {
# 使用whoosh引擎
# 'ENGINE': 'haystack.backends.whoosh_backend.WhooshEngine',
'ENGINE': 'haystack.backends.whoosh_cn_backend.WhooshEngine',
# 索引文件路径
'PATH': os.path.join(BASE_DIR, 'whoosh_index'),
}
} # 当添加、修改、删除数据时,自动生成索引
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'这是一个路径:
- 我找到Linux下面的路径:
- /home/andy/.virtualenvs/lq_py3/lib/python3.5/site-packages/haystack/backends
- 然后把我Windows下面的文件移动到这个地方,
- 这里面有jieba分词的代码,
生成索引文件:
- 搜索的是商品表的数据,
- 你要有索引文件的生成,最终是需要goossku这个类,新建一个这个类的一个索引类,
- 在templates下面建立文件夹search,下面建立indexes,这两个文件名都是固定的,
- 下面再建立goods文件夹,建立索引文件,
- 现在就可以生成索引数据了,
- >python manage.py rebuild_index
全文检索的应用:
- 两个地方,
- 1,是页面上搜索的地方要有一个提交搜索的目标路径,
- 2,是后台路由需要配置这个路径,这个是交给haystack来处理的,
- 还需要一个搜索结果页的html页面,
更改分词的方式:
- 比如,很不错的草莓,
- 但是你搜索不错,这是查不到的,
- 所以默认whoosh里面的引擎,在分解词语的时候分词不好,有些词分的不好,
- 我们要使用一个中文分词的包,就是jieba分词,这是中文默认的分词,比默认的要好,
- 这个分词怎么用:
- 第一步:安装
- 安装,pip install jieba,
- 有什么用?下面就是演示:
- import jieba,
- srt=‘很不错的草莓’
- res=jieba.cut(str,cut_all=True)
- for val in res:
- print(val)
很
不错
的
草莓- 这就是分词的结果,很不错,
- 那么怎么用呢?
- 第二步:在haystack目录新建一个文件,
- 还是进入Linux中,haystack的目录下:
- /home/andy/.virtualenvs/lq_py3/lib/python3.5/site-packages/haystack/backends
- 然后把Windows下面的文件ChineseAnalyzer.py复制一份到这个地方,
- 然后就可以了,
- 1,安装
- 2,新建一个文件,
- 3,修改文件,
- 4,修改配置,
- 5,重新建立索引,这次就是使用jieba分词了
python-django项目基础-haystack&whoosh&jieba_20191124的更多相关文章
- Python(Django)项目与Apache的管理
(开开心心每一天~ ---虫瘾师) Python(Django)项目交给Apache的管理(一) 准备:Django的环境(Python).Apache.Wsgi(必须文件) 首先需要电脑有Pytho ...
- Python(Django)项目与Apache的管理交互
(开开心心每一天~ ---虫瘾师) Python(Django)项目交给Apache的管理(一) 准备:Django的环境(Python).Apache.Wsgi(必须文件) 首先需要电脑有Pytho ...
- Python Django项目日志查询系统
该项目适合中小型公司日志查询工作.大型公司可以使用elk等.该系统其实就是调用了absible命令去查日志,然后把输出的信息输到页面查看. 日志查询系统 维护手册 作者:陈土锋 日期:2020年6月1 ...
- 使用Nginx+uwsgi在亚马逊云服务器上部署python+django项目完整版(二)——部署配置及相关知识
---恢复内容开始--- 一.前提: 1.django项目文件已放置在云服务器上,配置好运行环境,可正常运行 2.云服务器可正常连接 二.相关知识 1.python manage.py runserv ...
- 小试VS 2017 开发Python Django项目过程一
一.新建项目python ->django web 项目 (选择带bootstrap风格与twwriter)项目名称iepiececomputing (ie计件计算)跳出窗体 -> 添加虚 ...
- Python Django项目部署 Linux 服务器
项目依赖: Linux Centos7 (阿里云轻量级服务器) + Python 3.7.2 + Django 2.2.1 + restframework 3.9.4 + mysql 5.7 1 安装 ...
- python - django 项目部署 Ubuntu 服务器后接口访问一直 502 问题
问题描述:最近有了一台 Ubuntu 的服务器,然后准备部署个项目,结果没想到部署的过程跟用 Centos 的时候还有点不一样,最后一步我是卡在了 uwsgi 这里,访问一直502,且可以访问项目的静 ...
- python django项目创建及前期准备(使用pycharm)
一.创建django项目 1.打开pycharm软件 2.点击菜单栏 File-->New Project,弹出如下对话框,如下图设置 二.基本配置 1.静态文件目录配置(用于客户端访问后台服务 ...
- Django项目基础配置和基本使用
博文配置内容包括: django项目的创建 django项目下应用的创建及配置 数据库的配置 templates模板的配置 命令行创建项目: 在需要的目录下创建Django项目输入命令:django- ...
随机推荐
- 1.4CAD2017绘图基础
1.新建(ctrl+n) 命令:new 回车——默认样板(acadiso.dwt) 2.打开(ctr+o) 3.保存(ctrl+S) 4.鼠标的应用: 左键:点击拖选等: 中间滚轮:a.滚动,放大缩小 ...
- 关于PHP索引数组unset某key后json_encode相关问题踩坑记录
<?php $a = [1,2,3]; var_dump(json_encode($a)); #string(7) "[1,2,3]" unset($a[0]); var_d ...
- CommandNotFoundError: No command 'conda conda'.
出现情形 当前conda版本:4.6.11 当使用git bash,无论是在vscode中,还是在桌面上打开bash,都会出现这个错误.但是在cmd中,就可以识别conda命令. 解决 该错误只在4. ...
- django2:路由path语法
目录 1.问题引入 2.使用示例 3.path转化器 4.自定义转化器 4.1 定义 4.2 注册 5.使用正则表达式 6.Import变动 7.代码改写 8.总结 9月23,Django 发布了2. ...
- javascript编程中极易出现的错误(个人)
2018-08-10 1,setInterval打错字写成ser 2,document.getElementById().innerHTML;HTML需要全部大写 3,在for循环中定义一个i时要记住 ...
- Java基础三(2020.1.15)
学习内容: 1.Java流程控制之循环结构 2.Java数组 3.Java方法 1.随机数:math.random()得到0-1之间的数 math.random()*10+1得到1-10之间的 ...
- 实用 | PyCharm常用快捷键整理
PyCharm是一款非常受欢迎的Python IDE,用Python高效处理web和数据科学,带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具,比如调试.语法高亮.Project管理 ...
- JS控制 input 输入字符限制全搜集
ENTER键可以让光标移到下一个输入框 <input onkeydown="if(event.keyCode==13)event.keyCode=9" > 只能是中文 ...
- day56-mysql-其他查询-面试题-重点
一.重点 面试题 1. 临时表查询: -- 查询高于本部门平均工资的人员 #1.先查询部门人员的平均工资 SELECT dept_id,AVG(salary)as sal from person GR ...
- day53-线程池
#1.from concurrent import futures可以开启进程池和线程池.concurrent是包,futures是模块,ThreadPoolExecutor是类,submit是方法. ...