关于solr的一些知识】的更多相关文章

1.技术选型,为什么用solr而不用lucene,或者其他检索工具 lucene:需要开发者自己维护索引文件,在多机环境中备份同步索引文件很是麻烦 Lucene本质上是搜索库,不是独立的应用程序.而Solr是. Lucene专注于搜索底层的建设,而Solr专注于企业应用. Lucene不负责支撑搜索服务所必须的管理,而Solr负责. 一句话概括Solr: Solr是Lucene面向企业搜索应用的扩展 其实相识的技术还有ElasticSearch,但是ES只支持json文件格式,需要靠第三方插件提…
  一.Solr的简介 Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务.Solr可以独立运行在Jetty.Tomcat等这些Servlet容器中.都是Web服务器,Servlet容器,报文 ,JSON 格式字符串, XML格式字符串.Solr是一个可以独立运行的搜索服务器,使用solr进行全文检索服务的话,只需要通过http请求访问该服务器即可. 使用Solr 进行创建索引和搜索索引的实现方法很简单,如下: 创建索引:客户端(可以是浏览器可以是…
1.^ 控制符 (1)查询串上用^ 搜索: 天后王菲,如果希望将王菲的相关度加大,用^控制符. 天后  王菲^10.5  结果就会将含有王菲的document权重加大分数提高,排序靠前,10.5为权重. (2)feild上用^ name ^ 10 即name含有搜索串时候,权重比content含有搜索串的权重高,分数也就高. 2.*符号 当分词器中是最大切分时候,搜索小单元词汇"海波",如果分析器都分析为"黄海波",那么则用  *海波*  能搜索出结果!! 3.OR…
1.认识系统架构 1.1.集群概述 1.1.1.单点服务器的问题 我们之所以要学习集群,是因为单点服务器,存在一系列的问题. 我们以前学习的JavaEE项目,都是部署在一台Tomcat上,所有的请求,都由这一台服务器处理,存在很大风险: A:并发处理能力有限.因为单服务器的性能有限制.所以单台Tomcat的最大连接数有限制, B:容错率低,一旦服务器故障,整个服务就无法访问了. eBay于 1999年6月停机22小时的事故,中断了约230万的拍卖,使eBay的股票下降了9.2个百分点. C:单台…
简单了解 怎么理解Solr是个什么东西呢? 引用官网的介绍, Solr is the popular, blazing-fast, open source enterprise search platform built on Apache Lucene™. Solr是一个基于Lucene构建的,受欢迎且速度极快的企业搜索平台. 什么意思呢? 我的简单理解就是,Solr是一个独立系统,它给我们提供了很多api来操作它所连接的“数据库”,我们可以通过api对数据库进行CRUD操作,而且查询操作还贼…
Solr4.8.1和Tomcat7都可以到官方网站去下载,我这里就不多说了,如下图. 这里我们首先解压Solr-4.8.1.zip,再解压Tomcat,解压后,再在当前文件夹下建2个文件夹,一个用来放Solr的目录文件的,一个用来放Tomcat要跑起来的solr项目,如下图: 将\solr-4.8.1\example\solr下的文件拷贝到home文件夹下,将\solr-4.8.1\example\webapps下的solr.war拷贝到server目录下并解压并删除war包,如下图: 我们在h…
项目目的:OSChina 实现全文搜索的简单封装框架 License: Public Domain 包含内容: 重建索引工具 -> IndexRebuilder.java 增量构建索引工具 -> IndexUpdater.java 全文搜索框架 http://git.oschina.net/oschina/search-framework TngouDB 背景 TngouDB是天狗网(tngou.net)开发的中文搜索引擎数据库,用于天狗农业网的农业搜索引擎. 天狗希望基于开源的力量,把Tng…
solr DIH 知识梳理 web.xml中listener配置 <listener> <listener-class>org.apache.solr.handler.dataimport.scheduler.ApplicationListener</listener-class> </listener> 配置文件dataimport.properties ################################################# #…
将所有只用于搜索的,而不需要作为结果的field(特别是一些比较大的field)的stored设置为false 比如我们在solr中index了一篇word,对于这篇word,我们只需要这篇文章的下载地址,而不需要显示word的内容,并且这篇word又比较大.那么就不要stored了.(再仔细一点:我们已经用分析器将这篇word的内容索引了,能对其进行全文搜索了,那就不需要再存储这篇文章了) 多值Field(Multi-valued Fields) 比如一本书有多个作者,怎么办呢? 一种方法是,…
一 基本说明 简单来说Solr是基于Lucene的高性能的,开源的Java企业搜索服务器.Solr可以看作一个Web app,运行在tomcat或Jetty这类HTTP服务器上, 底层是一个基于Lucene的搜索引擎,还附加一个Solr的基本管理界面.Solr提供HTTP服务,通过Get方法进行查询,通过Post方法进行索引的添加/删除管理. 一般来说Solr的查询时通过Get方法请求到HTTP服务器的solr这个app下的/select对应的servlet上去,而添加等操作时通过POST方法到…