scws】的更多相关文章

PHP+mysql数据库开发类似百度的搜索功能:中英文分词+全文检索 中文分词: a)   robbe PHP中文分词扩展: http://www.boyunjian.com/v/softd/robbe.html i.  Robbe完整版本下载:Robbe完整版本(PHP测试程序, 开发帮助文档, WinNT下php各版本的dll文件)下载: http://code.google.com/p/robbe(“谷歌”无法使用) b) SCWS(简易中文分词) 基于HTTP/POST的分词 : htt…
<?php/** * 中文分词处理方法 *+--------------------------------- * @param stirng  $string 要处理的字符串 * @param boolers $sort=false 根据value进行倒序 * @param Numbers $top=0 返回指定数量,默认返回全部 *+--------------------------------- * @return void */function scws($text, $top = 5…
安装之前先确认您是否拥有主机的安装权限,否则无法进行安装,安装步骤如下: 1. 根据您当前用的 PHP 版本,下载相应已编译好的 php_scws.dll 扩展库. 目前支持以下版本   [PHP-4.4.x (44KB/VC6/ZTS)] [PHP-5.2.x (44KB/VC6/ZTS)] [PHP-5.3.x (40KB/VC9/ZTS)] [PHP-5.4.x (40KB/VC9/ZTS)] [PHP-5.3.x (40KB/VC9/NTS)] [PHP-5.4.x (40KB/VC9/…
Sphinx是一个基于SQL的全文检索引擎:普遍使用于很多网站:但由于中英文的差异,其本身,对中文的支持并不好.主要体现在对一段话断词:英文只需按照空格对其分词即可:但对于博大精深的中文来说,却是件困难的事情. 分词在两个地方会用到:1.索引时,根据分词索引原始数据2.搜索时,对用户输入分词,到索引中查询 本文提供了三种目前最常用的方案Coreseek.Sphinx-for-chinaese.Sphinx+Scws,并对其简单对比:在合适的场景,选择合适的方案,得出最优的解. 评测:一.Core…
SCWS 是 Simple Chinese Word Segmentation 的首字母缩写(即:简易中文分词系统).1.下载scws官方提供的类(这里使用的是pscws第四版的)http://www.xunsearch.com/scws/down/pscws4-20081221.tar.bz2下载XDB 词典文件 (这里使用的是utf8简体中文词典包)http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz22.解压scws类Ps…
转载自:http://blog.csdn.net/nuli888/article/details/51892776 Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检索引擎.意图为其他应用提供高速.低空间占用.高结果 相关度的全文搜索功能.Sphinx可以非常容易的与SQL数据库和脚本语言集成.当前系统内置MySQL和PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式 的XML数据. Sphinx创建索引的速度为:创建100万条记录的索引只需3-4分钟,…
1.安装sphnixcd /usr/local/srcwget http://sphinxsearch.com/files/sphinx-2.2.11-release.tar.gztar -zxvf sphinx-2.2.11-release.tar.gz cd sphinx-2.2.11-releaseyum install mysql56u-libs./configure --prefix=/usr/local/sphinx --with-mysqlmakemake install2.安装s…
mkdir scws cd scws wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2 tar xvjf scws-.tar.bz2 cd scws- ./configure --prefix=/usr/local/scws make && make install # 下载字典 cd /usr/local/scws/etc wget http://www.xunsearch.com/scws/down/scws-dict…
demo如下: /** * 中文分词 * @param $keyword * @param $getTop * @param $limit * @return array */ function splitWords($keyword, $getTop = false, $limit = 5): array { if (! $keyword) { return []; } $filePath = ini_get('scws.default.fpath'); $handle = scws_new(…
分词工具   sphinx  支持php版本5.2.2~6.0因此选用scws 文档地址 http://www.xunsearch.com/scws/docs.php#instscws 简单的demo(测试有效) $so = scws_new();//设置分词时所用编码$so->set_charset('utf-8');//设置分词所用词典(此处使用utf8的词典)$so->set_dict('/usr/local/scws/etc/dict.utf8.xdb');//设置分词所用规则$so-…