1.安装

1.1安装mmseg

./bootstrap # 必须执行,不然安装会失败
./configure --prefix=/usr/local/mmseg-3.2. #指定安装目录
make
make install

1.2安装coreseek

# 在csft-4.1/configure.ac中
# 查找 AM_INIT_AUTOMAKE([-Wall -Werror foreign])
# 更改 AM_INIT_AUTOMAKE([-Wall foreign])
sh buildconf.sh # 必须执行,不然安装失败
./configure --prefix=/usr/local/coreseek-4.1 --with-mysql --with-mysql-includes=/usr/local/mysql-5.6./include --with-mysql-libs=/usr/local/mysql-5.6./lib --with-mmseg --with-mmseg-includes=/usr/local/mmseg-3.2./include/mmseg --with-mmseg-libs=/usr/local/mmseg-3.2./lib
# 在csft-4.1/src/sphinxexpr.cpp中
# 查找 T val = ExprEval ( this->m_pArg, tMatch );
# 替换 T val = this->ExprEval ( this->m_pArg, tMatch );
make
make install

2.配置

测试数据表结构

CREATE TABLE `sph_counter` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT,
`code` varchar(50) NOT NULL DEFAULT '',
`max` int(10) unsigned NOT NULL,
`add_time` datetime NOT NULL,
PRIMARY KEY (`id`),
UNIQUE KEY `code` (`code`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8; CREATE TABLE `movie` (
`movie_id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT '影片ID',
`old_id` int(10) unsigned NOT NULL DEFAULT '' COMMENT '旧ID',
`sn` varchar(50) NOT NULL COMMENT '影片番号',
`title` varchar(255) NOT NULL COMMENT '片名',
`cover` varchar(255) NOT NULL DEFAULT '' COMMENT '影片封面图',
`publisher_id` int(10) unsigned NOT NULL COMMENT '发行商ID',
`publish_date` date NOT NULL COMMENT '发行日期',
`add_time` datetime NOT NULL COMMENT '添加时间',
PRIMARY KEY (`movie_id`),
UNIQUE KEY `sn` (`sn`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

coreseek主索引配置

source main_javzoo_movie
{
type = mysql sql_host = 127.0.0.1
sql_user = root
sql_pass =
sql_db = javzoo
sql_port = # optional, default is sql_query = \
SELECT movie_id, movie_id AS record_id, title \
FROM movie WHERE movie_id >= $start AND movie_id <= $end ORDER BY movie_id ASC
sql_query_pre = SET NAMES utf8
sql_query_pre = REPLACE INTO sph_counter SET `code` = 'movie', `max` = (SELECT MAX(movie_id) FROM movie), add_time = NOW()
sql_query_range = SELECT MIN(movie_id), (SELECT `max` FROM `sph_counter` WHERE `code` = 'movie') FROM movie
sql_range_step = sql_attr_uint = record_id } index main_javzoo_movie_title
{
source = main_javzoo_movie
path = /usr/local/coreseek-4.1/var/data/main_javzoo_movie_title
mlock =
morphology = none
min_word_len =
html_strip =
docinfo = extern
charset_type = zh_cn.utf-
charset_dictpath = /usr/local/mmseg-3.2./etc
ngram_len =
}

3.增量配置

source delta_javzoo_movie
{
type = mysql sql_host = 127.0.0.1
sql_user = root
sql_pass = shia802927
sql_db = javzoo
sql_port = sql_query_pre = SET NAMES utf8
sql_query_range = SELECT (SELECT `max` FROM `sph_counter` WHERE `code` = 'movie'), MAX(movie_id) FROM movie
sql_range_step =
sql_query = \
SELECT movie_id, movie_id AS record_id, title \
FROM movie WHERE movie_id >= $start AND movie_id <= $end ORDER BY movie_id ASC
sql_query_post = REPLACE INTO sph_counter SET `code` = 'movie', `max` = (SELECT MAX(movie_id) FROM movie), add_time = NOW() sql_attr_uint = record_id
} index delta_javzoo_movie_title
{
source = delta_javzoo_movie
path = /usr/local/coreseek-4.1/var/data/delta_javzoo_movie_title
mlock =
morphology = none
min_word_len =
html_strip =
docinfo = extern
charset_type = zh_cn.utf-
charset_dictpath = /usr/local/mmseg-3.2./etc
ngram_len =
}

4.定时更新脚本

 #!/bin/sh -
START_DATE=`date`
echo start $ index @ $START_DATE if [ "$1" = "all" ]
then
/usr/local/coreseek-4.1/bin/indexer --config /usr/local/coreseek-4.1/etc/sphinx.conf --all --rotate >> /dev/null
elif [ "$1" = "main" ]
then
/usr/local/coreseek-4.1/bin/indexer --config /usr/local/coreseek-4.1/etc/sphinx.conf main_javzoo_movie_title --rotate >> /dev/null
elif [ "$1" = "delta" ]
then
/usr/local/coreseek-4.1/bin/indexer --config /usr/local/coreseek-4.1/etc/sphinx.conf delta_javzoo_movie_title --rotate >> /dev/null
elif [ "$1" = "merge" ]
then
/usr/local/coreseek-4.1/bin/indexer --config /usr/local/coreseek-4.1/etc/sphinx.conf --merge main_javzoo_movie_title delta_javzoo_movie_title --rotate >> /dev/null
else
echo error action!
exit
fi END_DATE=`date`
if [ "$?" -eq "" ]
then
echo complete @ $END_DATE
else
echo error @ $END_DATE
fi
echo

用法

# 更新全部索引
sh sphinx_index.sh all
# 更新主索引
sh sphinx_index.sh main
# 更新增量索引
sh sphinx_index.sh delta
# 合并增量和主索引
sh sphinx_index.sh merge

备注

配合crond实现定时增量更新和合并

Sphinx(Coreseek)安装和使用指南的更多相关文章

  1. Sphinx(coreseek) 安装使用以及词库的扩展

    1.Sphinx(coreseek) 是啥 一般而言,Sphinx是一个独立的全文搜索引擎:而Coreseek是一个支持中文的全文搜索引擎,意图为其他应用提供高速.低空间占用.高结果相关度的中文全文搜 ...

  2. sphinx,coreseek安装

    sphinx是国外的一款搜索软件. coreseek是在sphinx的基础上,增加了中文分词功能,换句话说,就是支持了中文. Coreseek发布了3.2.14版本和4.1版本,其中的3.2.14版本 ...

  3. Coreseek安装测试配置指南(转)

    Sphinx--强大的开源全文检索引擎,Coreseek--免费开源的中文全文检索引擎 软件版本:coreseek-4.1 mmseg-3.2.14 autoconf-2.64 老版本的coresee ...

  4. 【PHP高效搜索专题(1)】sphinx&Coreseek的介绍与安装

    我们已经知道mysql中带有"%keyword%"条件的sql是不走索引的,而不走索引的sql在大数据量+大并发量的时候,不仅效率极慢还很有可能让数据库崩溃.那我们如何通过某些关键 ...

  5. Linux下coreseek环境安装 、mysql数据源、sphinx扩展安装及php调用

    一.安装m4-1.4.13.autoconf-2.64.automake-1.11.libtool-2.2.6 下载安装m4-1.4.13.autoconf-2.64.automake-1.11.li ...

  6. 搭建coreseek(sphinx+mmseg3)详细安装配置+php之sphinx扩展安装+php调用示例(转)

    一个文档包含了安装.增量备份.扩展.api调用示例,省去了查找大量文章的时间. 搭建coreseek(sphinx+mmseg3)安装 [第一步] 先安装mmseg3 cd /var/install ...

  7. coreseek安装

    一.  Sphinx简介 Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检索引擎.意图为其他应用提供高速.低空间占用.高结果 相关度的全文搜索功能.Sphinx可以非常容易的与 ...

  8. Sphinx学习之sphinx的安装篇

    一.  Sphinx简介 Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检索引擎.意图为其他应用提供高速.低空间占用.高结果 相关度的全文搜索功能.Sphinx可以非常容易的与 ...

  9. coreseek 安装及使用方法详解

    coreseek 安装及使用 一般站点都需要搜索功能,如果是php+mysql站点,建议选择coreseek,如果是java站点建议使用lucene,coreseek 是一款很好的中文全文检索/搜索软 ...

随机推荐

  1. UIPanGestureRecognizer判断滑动的方向

    .h文件 CGFloat const gestureMinimumTranslation = 20.0 ; typedef enum : NSInteger { kCameraMoveDirectio ...

  2. 用Xcode6的Leaks检测内存泄漏

    用xcode打开项目之后,选择Product - Profile: 在弹出的窗口中选择Leaks: 然后在设备解锁的情况下,选择Leaks再点击左上角的红色按钮开始运行APP: 红色的柱子表示有内存泄 ...

  3. linux-系统启动过程,执行的配置文件

    注意:环境变量的设置,都是通过export来设置的. export的使用详见:http://www.cnblogs.com/DengGao/p/6341443.html 环境变量是和Shell紧密相关 ...

  4. Microsoft Office Excel 2007 使用笔记

    1.显示表格边框: 选择要显示边框的单元格,点击“开始”选项卡中的“边框”图标,选中下拉框中的“所有框线” 2.单元格内,文字自动换行: 点击“开始”选项卡中的“自动换行”按钮 3.单元格内,文字手动 ...

  5. sqlserver 巧用REVERSE和SUBSTRING实现lastindexof

    原文:sqlserver 巧用REVERSE和SUBSTRING实现lastindexof select REVERSE(SUBSTRING(REVERSE(testFixtureNumber),0, ...

  6. mtd-utils 工具的使用

    mtd_debug [root@xmos /root]# mtd_debugusage: mtd_debug info <device>       mtd_debug read < ...

  7. Xml解析(Dom解析xml)

    xml四种解析方式: DOM 平台无关的官方解析方式 优点:形成了树结构,直观好理解,代码更易编写 解析过程中树结构保留在内存中,方便修改 缺点:当xml文件较大时,对内存耗费比较大,容易影响解析性能 ...

  8. Angularjs中的拦截器 (卧槽,好牛逼)

    $httpAngularJS 的 $http 服务允许我们通过发送 HTTP 请求方式与后台进行通信.在某些情况下,我们希望可以俘获所有的请求,并且在将其发送到服务端之前进行操作.还有一些情况是,我们 ...

  9. 2016.6.30 java.util.concurrent.ExecutionException java.lang.OutOfMemoryError

    选中ccs项目后,选择debug on server,但是运行到一半,跳出错误: java.util.concurrent.ExecutionException: java.lang.OutOfMem ...

  10. C#基于Socket的CS模式的完整例子

    基于Socket服务器端实现本例主要是建立多客户端与服务器之间的数据传输,首先设计服务器.打开VS2008,在D:\C#\ch17目录下建立名为SocketServer的Windows应用程序.打开工 ...