sphinx笔记

下载中文版coreseek包

1:解压后,将etc下的mysql。conf文件复制一份放到上级目录下,改名为sphinx。conf

2:配置文件:

2.1:source配置数据源

source goods

你要为那些数据建索引,比如,为php39数据库中的p39—goods表为数据源

sql_db = php39

sql_query 主查询,为那些数据建索引,就用一条语句他她们取出来 例如:select id, name,title from table   为这三个字段减索引

知识点:group_concat()  mysql函数

测试语句:SELECT group_concat(town) FROM `players` group by town

结果去查找town中去查找哪些值是一样的,如果相等,就全部列出来,以逗号分割进行列出,如下:

2.2:index 索引文件

一个数据源对应一个index

定义索引文件

index goods

{

source  = goods

生成的索引文件存放的目录注意,最后的goods是文件名叫goods 不是goods目录下

path = c:\****\goods

}

2.3:数据库配置

创建索引:

配置完成后,打开cmd  进入bin下降indexer。exe拉近cmd里来

*****。exe -c ****\sphinx.conf(这里是配置的那个路径)  goods -》 指的是哪一个数据源

回车就行,到此这个索引就建完了

安装并启动sphinx服务器

打开cmd 使用bin文件夹下的serchd。exe命令 拖入cmd中去

*** -c 配置的路径***\sphinx.conf --install

安装服务窗口中找到sphinx并启动

安装玩的那个窗口中输入services.msc即可

在本地服务窗口中可找到searchd这个服务,说明启动成功

项目中使用这个sphinx查询

A:将sphinx.api.php复制进项目中---放到根目录下就行

B:在控制器中使用php操作他

function keyserch(){

$key = I($key);

require('./sphinxapi.php');引入这个类文件,他是用来操作sphinx的类文件,调用它里面的方法用就行,不会的百度sphinxapi里的方法,手册有介绍

$sph = new \sphinxclient();

$sph = setserver('localhost',9312);连接服务器9312 是sphx的固定端口

$sph = query($key,goods);第一个参数是查询那个关键字,第二个参数是从那个索引文件里查询搜索,{ 指的是索引的名字 },这里是只index goods这里定义的这个

在牛逼一点的功能:

实时索引更新:个人理解  主索引+临时索引(增量索引) 来实现类似于实时更新的效果,原理是,为新数据生成个小的临时的索引文件,然后将索引文件合并到主索引文件中去

a:先给他建一个主索引,从这些索引文件中,查询出一个最大的商品id来 新建一个数据表,将这个最大的商品的id update存到这个表中

b:然后每次新添加的商品,因为不会自动建立索引,所以他们的id不会再索引文件中,他们的商品的id肯定比索引中的保存的最大的商品id要大

c: 然后给新添加的商品新建一个索引,按照上述方法,source goods数据源复制一份,改为 source goods_new 作为新索引数据源

index goods索引文件复制一份,改为index  goods_new  作为新索引的名字

然后合并主索引

修改sphx配置文件:新建一个数据表叫spinx_xin  字段为id

source goods

{

type=**

****

sql_query = select *****from p39_goods   建立的索引文件,此时为主索引

# 在创建好索引后吧最后一个商品的id更新到新建的表中:

$sql_query_post = update spinx_xin set id= (select max(id) from p39_goods )

}

测试一下:重新创建一下索引即可看到效果 注意:重建索引需在本地服务中心关闭search的这个sphinx服务  然后执行services.msc在启动 然后输入建立索引命令即可

新建索引不关闭服务器也行,在建索引命令后面加上 --rotate这个命令即可

执行完命令后就把id更新到表中了

注意:这里只是把索引的文件的商品id更新到了新表中,新的商品还没有索引

接下来就是给新商品新建索引,然后把它每过一段时间,合并到主索引中

复制source goods 为goods_new

修改索引的sql语句

source goods_new

{

******

****

*****

新商品id肯定大于索引中最大的商品的id,

因为已将最大的id存在spinx_xin  新表的id中

只要比较商品表中比这个新表的id大的就是新商品

修改sql语句,目的是查询出新商品,然后给新商品建索引

sql_query = select id ****from p39_goods  where  id>(select id from spinx_xin  )

******

}

同理新建了一个数据源就得新建一个index索引文件

复制一份index goods 索引文件在做相应的修改,新的索引就好了

写一个脚本,bat文件,目的有两个,

先给增量数据生成索引文件

把新生成的索引文件合并到主索引中

bat中写入建立索引的语句:

1:建立新的索引文件

****index.exe -c  ***\sphinx.conf(路径) goods_new

2:合并索引新索引文件到主索引文件中

****indexer.exe -c ***\sphinx.conf  --merge  goods   goods_new   --rotate   (这里别忘了写rotate相当于,自动关闭sghinx服务器建索引自动打开,上文有提到)

然后执行脚本文件

但是每次添加商品手动执行这个脚本更新索引,太麻烦了,所以还要配置一下这个脚本,让他自动每五分钟执行一次

window:管理工具--任务计划   设置五分钟自动执行脚本

linux:crond进程

sphinx笔记的更多相关文章

  1. sphinx随笔记了一下

    sphinx笔记 一:下载中文版coreseek包1:解压后,将etc下的mysql.conf文件复制一份放到上级目录下,改名为sphinx.conf2:配置文件: 2.1:source配置数据源so ...

  2. 【转】 文档与笔记利器 reStructuredText 和 Sphinx

    关于制作文档和笔记这种事,我已经纠结了很久,网上解决方案也一大推,我试过几样,ScrapBook 和 Zotero,编辑不太方便,同步麻烦.Google Note 过于格式简单,现在也不更新了,Goo ...

  3. 小白的linux笔记11:放弃gitbook,转战Sphinx

    gitbook生成的html目录不折叠且链接失效 装好了gitbook和nodejs,本以为可以安心的做电子书了. 谁想到gitbook慢的一P,而且导出来的html目录不折叠,最关键的是链接有问题, ...

  4. Sphinx学习笔记2

    因为网站搜索的需要,启动了一个搜索引擎项目,其实也算不上完整的搜索引擎,需求很简单,如下:     1)搜索产品名.类别名.品牌名.副标题.关键字等字段     2)数据量目前为13000左右,未来可 ...

  5. Sphinx学习笔记(一)

    最近负责一个项目,需要用到全文检索,我的环境大体如下:       1.数据保存在MySQL中     2.需要支持中文检索     3.尽可能的简单       选择了Sphinx,至于solr和E ...

  6. sphinx搜索 笔记

    架构图: 安装sphinx,见文章http://my.oschina.net/ptk/blog/495435 sphinx关键的配置文件.在里面写查询的sql. 两个关键命令:indexer生成查询索 ...

  7. sphinx通过增量索引实现近实时更新

    一.sphinx增量索引实现近实时更新设置 数据库中的已有数据很大,又不断有新数据加入到数据库中,也希望能够检索到.全部重新建立索引很消耗资源,因为我们需要更新的数据相比较而言很少. 例如.原来的数据 ...

  8. coreseek (sphinx)+ Mysql + Thinkphp搭建中文搜索引擎详解

      一, 前言    1,研究coreseek的动机 我有一个自己的笔记博客,经常在上面做一些技术文章分析.在查询一些文章的时候,以前只能将要查询的内容去mysql中用like模糊匹配.在文章多了的情 ...

  9. sphinx 增量索引 实现近实时更新

    一.sphinx增量索引的设置   数据库中的已有数据很大,又不断有新数据加入到数据库中,也希望能够检索到.全部重新建立索引很消耗资源,因为我们需要更新的数据相比较而言很少.例如.原来的数据有几百万条 ...

随机推荐

  1. Linux中rm命令详解

    linux下rm命令使用详解---linux删除文件或目录命令 用户可以用rm命令删除不需要的文件.该命令的功能为删除一个目录中的一个或多个文件或目录,它也可以将某个目录及其下的所有文件及子目录均删除 ...

  2. java中自己常犯的错误汇总

    package debug; /** 1.定义一个公共的动物类,包含名字.年龄.颜色和吃饭东西方法 2.定义一个猫类,继承动物类,同时拥有玩游戏的本领 3.定义一个狗类,继承动物类,同时拥有看门的本领 ...

  3. maven 如何依赖工程项目里面的 jar 包

    前言:现在有个 jar 包在私服和公共仓库里面都没有,需要自己将 jar 包放在工程里,然后让 maven 依赖. 这里举个栗子 项目路径: pom.xml 配置 <!--自定义查询组件的jar ...

  4. a标签禁止跳转或者不跳转的几种实现方式

    1.onclick事件中返回false <a href="http://www.baidu.com"  onclick="return false" &g ...

  5. Schwartz–Zippel lemma

    鬼知道老师从哪儿扒的这东西啊,.... 百度了一下毛都没有啊,维基百科看不懂啊.. 定理 一个$m$元$n$次多项式,在域$F$内随机给每个变量赋值 等于零的概率小于$\dfrac{n}{|F|}$ ...

  6. 洛谷P3899 [湖南集训]谈笑风生(线段树合并)

    题意 题目链接 Sol 线段树合并板子题,目前我看到两种写法,分别是这样的. 前一种每次需要新建一个节点,空间是\(O(4nlogn)\) 后者不需要新建,空间是\(O(nlogn)\)(面向数据算空 ...

  7. Redis 入门 安装 命令

    win7 64位安装redis 及Redis Desktop Manager使用 引自:http://blog.csdn.net/joyhen/article/details/47358999 写基于 ...

  8. ionic 项目中,ng-bind-html会过滤掉内嵌样式的问题

    一.引入$sce,转化一步即可 $scope.articlesdetail.info = $sce.trustAsHtml($scope.articlesdetail.info); 参考网址: htt ...

  9. PostgreSQL 10 如何使用 PgAdmin3

    自从 PgAdmin4 出来以后,PgAdmin3 就停止开发了,PgAdmin 官网下载的 PgAdmin3 无法支持 PostgreSQL 10 或者更高版本的数据库服务器端. 但是 PgAdmi ...

  10. 程序员Web面试之jQuery

    又到了一年一度的毕业季了,青春散场,却等待下一场开幕. 在求职大军中,IT行业的程序员.码农是工科类大学生的热门选择之一, 尤其是近几年Web的如火如荼,更是吸引了成千上万的程序员投身其中追求自己的梦 ...