golang全文搜索--使用sphinx
不多废话,测试环境 `ubuntu 13.10`
## 安装
sudo apt-get install sphinxsearch
## 配置
nano /etc/sphinxsearch/sphinx.conf
# 数据源配置
source default
{
type = xmlpipe2
xmlpipe_command = /path/xmlpipe2
xmlpipe_fixup_utf8 = 1
}
# 索引配置
index default
{
type = plain
source = default
# 索引文件路径
path = /path/filename
# 不存储文档信息
docinfo = none
#最小索引词长度
min_word_len = 2
charset_type = utf-8
# 指定utf-8的编码表
charset_table = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F
# 简单分词,只支持0和1,如果要搜索中文,请指定为1
ngram_len = 1
# 需要分词的字符,如果要搜索中文,去掉前面的注释
ngram_chars = U+3000..U+2FA1F
}
## xmlpipe2的格式
...
...
...
...
只要配置文件中 xmlpipe_command 字段配置的可执行文件输出为相应的xml流即可,这样几乎适配了所有数据源
## 生成索引
$ indexer default
Sphinx 2.0.4-release (r3135)
Copyright (c) 2001-2012, Andrew Aksyonoff
Copyright (c) 2008-2012, Sphinx Technologies Inc (http://sphinxsearch.com)
using config file '/etc/sphinxsearch/sphinx.conf'...
indexing index 'default'...
WARNING: Attribute count is 0: switching to none docinfo
WARNING: collect_hits: mem_limit=0 kb too low, increasing to 12288 kb
collected 4 docs, 0.0 MB
sorted 0.0 Mhits, 100.0% done
total 4 docs, 47 bytes
total 0.000 sec, 54970 bytes/sec, 4678.36 docs/sec
total 2 reads, 0.000 sec, 0.0 kb/call avg, 0.0 msec/call avg
total 6 writes, 0.000 sec, 0.0 kb/call avg, 0.0 msec/call avg
## 查询
$ search 55
Sphinx 2.0.4-release (r3135)
Copyright (c) 2001-2012, Andrew Aksyonoff
Copyright (c) 2008-2012, Sphinx Technologies Inc (http://sphinxsearch.com)
using config file '/etc/sphinxsearch/sphinx.conf'...
index 'default': query '55 ': returned 1 matches of 1 total in 0.000 sec
displaying matches:
1. document=233221, weight=1695
words:
1. '55': 1 documents, 1 hits
## 配置searchd
编辑sphinx配置文件,添加:
## 监听地址
searchd
{
# 监听地址(Unix socket)
listen = /var/log/searchd.sock
# 日志文件
log = /var/log/searchd.log
# 查询日志
query_log = /var/log/query.log
# 客户端读取超时时间
read_timeout = 5
# 客户端请求超时时间
client_timeout = 3000
# PID 文件
pid_file = /var/log/searchd.pid
}
## 运行searchd
$ sudo searchd
Sphinx 2.0.4-release (r3135)
Copyright (c) 2001-2012, Andrew Aksyonoff
Copyright (c) 2008-2012, Sphinx Technologies Inc (http://sphinxsearch.com)
using config file '/etc/sphinxsearch/sphinx.conf'...
WARNING: compat_sphinxql_magics=1 is deprecated; please update your application and config
listening on UNIX socket /var/log/searchd.sock
precaching index 'default'
precached 1 indexes in 0.000 sec
验证一下状态
$ searchd --status
Sphinx 2.0.4-release (r3135)
Copyright (c) 2001-2012, Andrew Aksyonoff
Copyright (c) 2008-2012, Sphinx Technologies Inc (http://sphinxsearch.com)
using config file '/etc/sphinxsearch/sphinx.conf'...
searchd status
--------------
uptime: 7
connections: 1
maxed_out: 0
## golang客户端
package main
import (
"github.com/yunge/sphinx"
"log"
)
func main() {
// 链接参数
opts := &sphinx.Options{
Socket: "/var/log/searchd.sock",
Timeout: 5000,
}
// 创建客户端
spClient := &sphinx.Client{Options: opts}
if err := spClient.Error(); err != nil {
log.Fatal(err)
}
// 打开链接
if err := spClient.Open(); err != nil {
log.Fatal(err)
}
// 获取实例信息
status, err := spClient.Status()
if err != nil {
log.Fatal(err)
}
for _, row := range status {
log.Printf("%20s:\t%s\n", row[0], row[1])
}
// 查询
res, err := spClient.Query("33", "default", "Test Query()")
if err != nil {
log.Fatal(err)
}
log.Println(res)
}
输出:
2013/12/05 01:14:55 uptime: 148
2013/12/05 01:14:55 connections: 2
2013/12/05 01:14:55 maxed_out: 0
2013/12/05 01:14:55 command_search: 0
2013/12/05 01:14:55 command_excerpt: 0
2013/12/05 01:14:55 command_update: 0
2013/12/05 01:14:55 command_keywords: 0
2013/12/05 01:14:55 command_persist: 2
2013/12/05 01:14:55 command_status: 2
2013/12/05 01:14:55 command_flushattrs: 0
2013/12/05 01:14:55 agent_connect: 0
2013/12/05 01:14:55 agent_retry: 0
2013/12/05 01:14:55 queries: 0
2013/12/05 01:14:55 dist_queries: 0
2013/12/05 01:14:55 query_wall: 0.000
2013/12/05 01:14:55 query_cpu: OFF
2013/12/05 01:14:55 dist_wall: 0.000
2013/12/05 01:14:55 dist_local: 0.000
2013/12/05 01:14:55 dist_wait: 0.000
2013/12/05 01:14:55 query_reads: OFF
2013/12/05 01:14:55 query_readkb: OFF
2013/12/05 01:14:55 query_readtime: OFF
2013/12/05 01:14:55 avg_query_wall: 0.000
2013/12/05 01:14:55 avg_query_cpu: OFF
2013/12/05 01:14:55 avg_dist_wall: 0.000
2013/12/05 01:14:55 avg_dist_local: 0.000
2013/12/05 01:14:55 avg_dist_wait: 0.000
2013/12/05 01:14:55 avg_query_reads: OFF
2013/12/05 01:14:55 avg_query_readkb: OFF
2013/12/05 01:14:55 avg_query_readtime: OFF
2013/12/05 01:14:55 ] 0}
api参考 http://gowalker.org/github.com/yunge/sphinx
sphinx配置参考 http://www.coreseek.cn/docs/coreseek_4.1-sphinx_2.0.1-beta.html
golang全文搜索--使用sphinx的更多相关文章
- MySQL+Sphinx实现全文搜索
最近在做一个搜索引擎,主要是对图书方面的对象级的搜索,首先来了解下Sphinx吧. 它能够提高你的查询的速度,这个不是一般的快. Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,Pos ...
- mac 下 sphinx + mysql + php 实现全文搜索(xampp)(3)sphinx 的配置项解析
source:数据的来源,数据是从什么地方来的. index:索引,当有数据源之后,从数据源处构建索引.索引实际上就是相当于一个字典检索.有了整本字典内容以后,才会有字典检索. searchd:提供搜 ...
- ubuntu上 安装 基于sphinx 的 coreseek 全文搜索
原生sphinx不支持中文, sphinx-for-chinese匹配中文时也不返回结果 ,真纠结, 最好试了 coreseek,这个能正确返回结果了, 所以记录一下 1 http://www.co ...
- php+中文分词scws+sphinx+mysql打造千万级数据全文搜索
转载自:http://blog.csdn.net/nuli888/article/details/51892776 Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检索引擎.意图 ...
- [转]Sphinx+Mysql+中文分词安装-实现中文全文搜索
From : http://blog.csdn.net/lgm252008/article/details/5373436 1.什么是SphinxSphinx 是一个在GPLv2 下发布的一个全文检索 ...
- window环境下,php+sphinx+coreseek实现简单的中文全文搜索
就以我个人理解来说,sphinx其实是介于客户端和mysql之间的一个索引表,把数据库的没一条记录假设为文档,那么这个索引表其实保存的就是这条记录的关键词及其对应的文档id 1.sphinx的安装 下 ...
- coreseek实战(三):全文搜索在php中应用(使用api接口)
coreseek实战(三):全文搜索在php中应用(使用api接口) 这一篇文章开始学习在php页面中通过api接口,使用coreseek全文搜索. 第一步:综合一下前两篇文章,coreseek实战( ...
- MySQL 全文搜索支持, mysql 5.6.4支持Innodb的全文检索和类memcache的nosql支持
背景:搞个个人博客的全文搜索得用like啥的,现在mysql版本号已经大于5.6.4了也就支持了innodb的全文搜索了,刚查了下目前版本号都到MySQL Community Server 5.6.1 ...
- MySQL 全文搜索支持
MySQL 全文搜索支持 从MySQL 4.0以上 myisam引擎就支持了full text search 全文搜索,在一般的小网站或者blog上可以使用这个特性支持搜索. 那么怎么使用了,简单看看 ...
随机推荐
- C++混合编程之idlcpp教程Python篇(2)
在上一篇 C++混合编程之idlcpp教程(一) 中介绍了 idlcpp 工具的使用.现在对 idlcpp 所带的示例教程进行讲解,这里针对的 Python 语言的例子.首先看第一个示例程序 Pyth ...
- 【转载】我也说 IEnumerable,ICollection,IList,List之间的区别
做C#的同学们,都知道,一类只能有一个继承类,但可以实现多个接口.这句话就告诉我们:IEnumerable,ICollection,IList,List区别了 首先我看看 IEnumerable: / ...
- 一步一步搭建客服系统 (3) js 实现“截图粘贴”及“生成网页缩略图”
最近在做一个客服系统的demo,在聊天过程中,我们经常要发一些图片,而且需要用其它工具截图后,直接在聊天窗口里粘贴,就可以发送:另外用户输入一个网址后,把这个网址先转到可以直接点击的link,并马上显 ...
- .Net免费公开课视频+资料+源码+经典牛逼 汇总篇【持续更新】
博主推荐一:WP8.1最经典培训教程 博主点评:经典Windows Phone8.1 Runtime API培训最经典教程,此教程由传智播客蒋坤老师录制的一整套WP8.1入门级视频教程,讲授内容非常广 ...
- Java并行程序设计模式小结
这里总结几种常用的并行程序设计方法,其中部分文字源自<Java程序性能优化>一书中,还有部分文字属于个人总结,如有不对,请大家指出讨论. Future模式 一句话,将客户端请求的处理过程从 ...
- [BTS] SQL Adapter. New transaction cannot enlist in the specified transaction coordinator
The adapter "SQL" raised an error message. Details "New transaction cannot enlist in ...
- duilib进阶教程 -- 改进窗口拖动 (12)
现在大家应该都知道caption="0,0,0,32",是指示标题栏区了吧,如果想要整个窗口都能拖动呢? 那直接把高度改成和窗口一样不就得了~O(∩_∩)O~ 嗯,这样是可以,比如 ...
- paip.mysql fulltext 全文搜索.最佳实践.
paip.mysql fulltext 全文搜索.最佳实践. 作者Attilax 艾龙, EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blo ...
- Atitit.guice3 ioc 最佳实践 o9o
Atitit.guice3 ioc 最佳实践 o9o 1. Guice的优点and跟个spring的比较 1 2. 两个部分:::绑定and注入@Inject 1 3. 绑定所有的方法总结 2 3. ...
- 记忆化搜索hdu1078 dfs
http://acm.hdu.edu.cn/showproblem.php?pid=1078 题意:给出n*n的格子,每个各自里面有些食物,问一只老鼠每次走最多k步所能吃到的最多的食物 #includ ...