Solr入门(一)】的更多相关文章

随着solr版本的不断升级, 差异越来越大, 从以前的 solr1.2 到现在的 solr4.3, 无论是类还是功能都有很大的变换, 为了能及时跟上新版本的步伐, 在此将新版本的使用做一个简单的入门说明: Solr3.6版本 SolrServer实例化类型有httpClient,和本地化,如果Solr服务器不在本地就用httpClient,在本地就用EmbeddedSolrServer SolrServer可以操作索引,包括更新删除查询等操作 以下是httpClient实例化方式,需要tomca…
solr入门案例 solr是apache下的一个全文检索引擎系统. 我们需要在服务器上单独去部署solr, 通过它的客户端工具包solrJ, 就是一个    jar包, 集成到我们项目中来调用服务器中的solr.    solr底层使用lucene开发 部署步骤:    1. 准备一个干净的Tomcat, 没有任何项目都可以运行的.    2. 将solr/example/webapps/solr.war复制到Tomcat/webapps/目录下    3. 运行Tomcat,运行日志会报错,…
Apache Solr入门教程(初学者之旅) 写在前面:本文涉及solr入门的各方面,建议边思考边实践,相信能帮助你对solr有个清晰全面的了解并能简单实用. 在Apache Solr初学者教程的这个例子中,我们将讨论有关如何安装最新版本的Apache Solr,并告诉你如何配置它.此外,我们将告诉你如何进行使用solr的样本数据文件索引.Apache Solr支持不同格式,包括各种数据库,PDF文件,XML文件,CSV文件等等.在这个例子中,我们将研究如何从一个CSV文件索引数据. 首选这个例…
一.Spring Data Solr简介 前面已经介绍了通过solrJ来操作solr,那么我们如何将Solr的应用集成到Spring中?Spring Data Solr就是为了方便Solr的开发所研制的一个框架,其底层是对SolrJ(官方API)的封装. 二.Spring Data Solr入门案例 2.1 搭建工程 (1)创建maven工程,pom.xml中引入依赖 <dependencies> <dependency> <groupId>org.springfram…
一丶Solr入门1.Solr的启动Solr各版本下载老版本的时候,需要将war包放到tomcat中,现在只需解压,由于自带jetty容器,可以直接启动 [root@aaa bin]# ./solr start -force -p 8983 *** [WARN] *** Your open file limit is currently 1024. It should be set to 65000 to avoid operational disruption. If you no longer…
如何将Solr的应用集成到Spring中? SpringDataSolr就是为了方便Solr的开发所研制的一个框架,其底层是对SolrJ的封装. SpringDataSolr入门小Demo 首先目录结构为: 搭建工程,需要引入的依赖为: <dependencies> <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-solr</a…
Solr采用Lucene搜索库为核心,提供全文索引和搜索开源企业平台,提供REST的HTTP/XML和JSON的API,如果你是Solr新手,那么就和我一起来入门吧!本教程以solr4.8作为测试环境,jdk版本需要1.7及以上版本. 准备 本文假设你对Java有初中级以上水平,因此不再介绍Java相关环境的配置.下载解压缩solr,在example目录有start.jar文件,启动: 1 java -jar start.jar 浏览器访问:http://localhost:8983/solr/…
友情提示Solr的内容还是比较多的,一篇文章只能讲解一部分.全面介绍,没兴趣,没时间,也没能力,回报还不大.本文只写点我认为比较重要的知识点,独特的个人想法.仅供参考哦,更多细节需要自己去琢磨. 概述Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器.同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置.可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎. 工作方式文档通过Http利用XML 加到一个搜索集…
阮一峰:全文搜索引擎 Elasticsearch 入门教程 作者:阮一峰 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial 喜欢的话麻烦点下Star哈 本系列文章将整理于我的个人博客: www.how2playlife.com 该系列博文会介绍常见的后端技术,这对后端工程师来说是一种综合能力,我们会逐步了解搜索技术,云计算相关技术.大数据研发等常见的技术喜提,以便让你更完整…
前言 solr是apache项目的一款全文搜索应用. 官方文档http://lucene.apache.org/solr/guide/6_6/ 入门流程 1.安装   --->  2.启动  --->  3.创建核心  ---> 4.添加文档   ---> 5.url接口查询 1.安装 下载solr-6.6.0.tgz包,解压任意目录 2.启动 /opt/solr-/bin ./solr start -force #root用户需要加force 3.创建核心 #创建索引数据文件存放…
Solr中虽然提供了一个中文分词器,但是效果很差,可以使用IKAnalyzer或Mmseg4j 或其他中文分词器. 一.IKAnalyzer分词器配置: 1.下载IKAnalyzer(IKAnalyzer2012_u6)包,当前使用版本IKAnalyzer2012_u6.jar 2.将IKAnalyzer2012_u6包下的IKAnalyzer.cfg.xml和stopword.dic复制到solr应用/WEB-INF/classes下. 3.在${solr_home}/[core路径下]/co…
solrconfig.xml包含了用于配置自身行为的绝大部分参数,其作用范围是当前core.该文件位于${solr_home}/solr/core1/conf/下. 参数列表概览: A.lib B.dataDir parameter C.directoryFactory D.codecFactory E.indexConfig Section F.Update Handler Section G.The Query Section H.Request Dispatcher I.Request H…
该配置文件中的标签:<fileTypes>.<fields>.<uniqueKey>.<copyField> fieldType说明 标签types中定义了field可以使用的类型,类型定义中可以指定document中字段的常用属性及分词规则.solr中提供了多个预定义的fieldType,另外用户也可以自定义fieldType(比如中文分词的配置). 一.fieldType常用属性: A.name: 字段类型名 B.class: java类名 C.inde…
<?xml version="1.0" encoding="UTF-8" ?> <!-- This is an example of a simple "solr.xml" file for configuring one or more Solr Cores, as well as allowing Cores to be added, removed, and reloaded via HTTP requests. More…
由于solr底层使用lucene,所以很多概念与lucene相同,下面是几个常用的概念: * Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放. * Field:Document中的一个字段,相当于数据库中的Column ,Field是lucene比较多概念一个术语,详细见后. * 个参数:索引存放的路径,分析器和是否重新创建索引.特别注意的一点,当IndexWriter执行完addDocument方法后,一定要记得调用自…
Solr作为一个web应用来启动,因此需要JDK支持,需要WEB容器,本文环境如下: JDK6.0或以上(环境变量设置等不再赘述) Tomcat-6.0.35或以上(自行下载) apache-solr-3.6.2.zip(http://www.apache.org/dyn/closer.cgi/lucene/solr/) Windows 7 : Solr提供了一个WEB应用,位于apache-solr-3.6.2解压包的/dist文件夹下,即apache-solr-3.6.2.war文件,为了方…
一.前言:为何选择Solr 由于搜索引擎功能在门户社区中对提高用户体验有着重在门户社区中涉及大量需要搜索引擎的功能需求,目前在实现搜索引擎的方案上有几种方案可供选择: 1. 基于Lucene自己进行封装实现站内搜索.工作量及扩展性都较大,不采用. 2. 调用Google.Baidu的API实现站内搜索.同第三方搜索引擎绑定太死,无法满足后期业务扩展需要,暂时不采用. 3.基于Compass+Lucene实现站内搜索.适合于对数据库驱动的应用数据进行索引,尤其是替代传统的like ‘%expres…
#####################shell命令############################# 导入文档: sh bin/post -c gettingstarted docs/index.html 删除全部文档: sh bin/post -c gettingstarted -d "<delete><query>*:*</query></delete>" 删除示例: bin/solr stop -all ; rm -R…
阅读目录 引言 Lunece是什么? Solr是什么 JAVA环境搭建 JAVA环境搭建之变量配置 Tomcat简单配置 结尾 引言 君子生非异也,善假于物也. Java和.Net哪个好,我们也不需要打口水战,我认为语言只是我们达到目的的工具而已,某个业务场景哪个顺手用哪个(包括除此两种以外的所有语言),当然要精通一门语言是很难的事情,需要我们持之以恒. 回到顶部 Lunece是什么? Lucene是当前以及最近几年最受欢迎的免费Java信息检索程序库. Lunece也是有.Net版本的---L…
本文转自http://chuanliang2007.spaces.live.com/blog/cns!E5B7AB2851A4C9D2!499.entry?wa=wsignin1.0 因为搜索引擎功能在门户社区中对提高用户体验有着重在门户社区中涉及大量须要搜索引擎的功能需求.眼下在实现搜索引擎的方案上有集中方案可供选择: 1. 基于Lucene自己进行封装实现站内搜索.工作量及扩展性都较大,不採用. 2. 调用Google.Baidu的API实现站内搜索.同第三方搜索引擎绑定太死.无法满足后期业…
1.为什么选择Apache Solr Apache Solr是一个功能强大的搜索服务器,它支持REST风格API.Solr是基于Lucene的,Lucene 支持强大的匹配能力,如短语,通配符,连接,分组和更多不同的数据类型.它使用 Apache Zookeeper特别针对高流量进行优化.Apache Solr提供各式各样的功能,我们列出了部分最主要的功能. 先进的全文搜索功能. XML,JSON和HTTP - 基于开放接口标准. 高度可扩展和容错. 同时支持模式和无模式配置. 分页搜索和过滤.…
Apache Solr 是Apache Lucene项目的开源企业搜索平台.其主要功能包括全文检索.命中标示.分面搜索.动态聚类.数据库集成,以及富文本(如Word.PDF)的处理.Solr是高度可扩展的,并提供了分布式搜索和索引复制.Solr是最流行的企业级搜索引擎,Solr 4还增加了NoSQL支持,还支持REST风格API.支持强大的匹配能力,如短语,通配符,连接,分组和更多不同的数据类型.它使用 Apache Zookeeper特别针对高流量进行优化.Apache Solr提供各式各样的…
做搜索引擎避免不了排序问题,当排序没有要求时,solr有自己的排序打分机制及sorce字段 1.无特殊排序要求时,根据查询相关度来进行排序(solr自身规则) 2.当涉及到一个字段来进行相关度排序时,可以直接使用solr的sort功能来实现 3.对多个字段进行维度的综合打分排序(这个应该才是重点,内容) 使用Solr搭建搜索引擎很容易,但是如何制定合理的打分规则(boost)做排序却是一个很头痛的事情.Solr本身的排序打分规则是继承自 Lucene的文本相关度的打分即boost,这一套算法对于…
上篇博客中我简单的讲了下solr自身的suggest模块来实现搜索建议.但是今天研究了下在solr自身的suggest中添加进去拼音来智能推荐时不时很方便.在次从网上搜集和整理思考了下该问题的解决. http://www.cnblogs.com/huangfox/p/4146970.html 问题背景 搜索关键字智能提示是一个搜索应用的标配,主要作用是避免用户输入错误的搜索词,并将用户引导到相应的关键词上,以提升用户搜索体验. 美团CRM系统中存在数以百万计的商家,为了让用户快速查找到目标商家,…
首先看一下从淘宝输入搜索keyword获取到的一些数据信息: 第一张:使用拼音的全程来查询 能够看到提示的是匹配的转换的拼音的方式,看最后一个提示项 这里另一个在指定分类文件夹下搜索的功能,难道后台还存储的类目的信息? 另一个标签的信息要存储 第二使用首字母来匹配 这里看不出来 淘宝的东西太多了,首字母直接有了相应的全程 watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA…
Solr调研总结 开发类型 全文检索相关开发 Solr版本 4.2 文件内容 本文介绍solr的功能使用及相关注意事项;主要包括以下内容:环境搭建及调试;两个核心配置文件介绍;维护索引;查询索引,和在查询中可以应用的高亮显示.拼写检查.搜索建议.分组统计.拼音检索等功能的使用方法. 版本 作者/修改人 日期 V1.0 gzk 2013-06-04       1. Solr 是什么? Solr它是一种开放源码的.基于 Lucene Java 的搜索服务器,易于加入到 Web 应用程序中.Solr…
1 solr的下载 从Solr官方网站(http://lucene.apache.org/solr/ )下载Solr最新版本,根据Solr的运行环境,Linux下需要下载solr-7.3.1.tgz,windows下需要下载solr-7.3.1.zip. Solr使用指南可参考:https://wiki.apache.org/solr/FrontPage. 本教程中我使用的是solr-4.10.3.zip版本.新版本大体上都是一样的.注意solr-7.3.1需要的jdk的版本须在1.8及其以上.…
涉及的问题: 建索引时有一个字段是该词语出现的次数,这个字段是放在solr里的  而我用的是多线程来进行全量导入的,这里就涉及到了多线程问题 多个线程操作同一个变量时怎样处理? 我是这样子做的 : 首先将变量本地话--分布式就放到大容器中,我这里只使用了一个map来存 词和次数的关系映射 变量本地化后就是多线程的攻克了--锁的设置-我不过在操作时加了一个锁来解决问题 这样做后整体上应该能解决变量的问题了 最后另一个线程顺序问题要解决下 当 最后一个提交索引时 获取的索引不一定是正确的索引 当两个…
今天主要是收集了些拼写检查方面的资料和 尝试使用一下拼写检查的功能--=遇到了不少问题 拼写检查的四种配置眼下我仅仅算是成功了半个吧 --------------------------------- 拼写检查功能,能在搜索时,提供一个较好用户体验.所以,主流的搜索引擎都有这个功能.在这之前,笔者先简单的说一下什么是拼写检查,事实上非常好理解.就是你输入的搜索词,可能是你输错了,也有可能在它的检索库里面根本不存在这个词.可是这时候它能给你返回,相似或相近的结果来帮助你校正. 举个样例.假如你在百…
package com.offcn.pojo; import java.io.Serializable; import java.math.BigDecimal; import java.util.Date; import org.apache.solr.client.solrj.beans.Field; public class TbItem implements Serializable{ @Field private Long id; @Field("item_title") p…