solr学习笔记-开篇】的更多相关文章

由于工作需要,近期接触了一下全文检索的相关技术,从lucenen到solr开始慢慢一路摸爬滚打,仅以此文记录自己的学习里程和记录下各种坑. 本次学习基于以下环境版本: java7,solr5.5.4(能支持java7的最高solr版本),tomcat8(8.0或以上),zookeeper3.4.10,centos7_x64 首先自行安装虚拟机并安装好linux系统(该笔记基于centos7_x64,windows下也可以,但是由于实际环境都是在linux中,所以直接在liunx中进行学习.)并做…
原文地址:[Head-First设计模式]C#版-学习笔记-开篇及文章目录 最近一年断断续续的在看技术书,但是回想看的内容,就忘了书上讲的是什么东西了,为了记住那些看过的东西,最好的办法就是敲代码验证,然后将书上的内容和自己的总结一起分享出来,这样看书的效果就会有大大提升. 最近在看一本讲JAVA设计模式的书,本人是C#开发,并想将书上的内容转换成C#的,然后写到博客上,以后查阅也方便,大家也可以参考参考. 本篇是开篇,也是文章目录. 01.策略模式-上篇 02.单件模式 03.命令模式 参考文…
Solr学习笔记之3.Solr导入SQLServer数据建立索引 一.下载MSSQLServer的JDBC驱动 下载:Microsoft JDBC Driver 4.0 for SQL Server 地址:http://www.microsoft.com/zh-CN/download/details.aspx?displaylang=en&id=11774 二.配置Solr dataimport for SQLServer 1.依赖jar包配置 将MSSQLServer的JDBC驱动中的sqlj…
Solr学习笔记之2.集成IK中文分词器 一.下载IK中文分词器 IK中文分词器 此文IK版本:IK Analyer 2012-FF hotfix 1 完整分发包 二.在Solr中集成IK中文分词器 1.将 IKAnalyzer.cfg.xml,IKAnalyzer2012FF_u1.jar,stopword.dic 拷贝到tomcat的/webapps/solr/WEB-INF/lib/下面 2.选择某一Solr的core配置IK分词,打开coreName/conf/schema.xml,在<…
Solr学习笔记之1.环境搭建 一.下载相关安装包 1.JDK 2.Tomcat 3.Solr 此文所用软件包版本如下: 操作系统:Win7 64位 JDK:jdk-7u25-windows-i586.exe Tomcat:apache-tomcat-8.0.3.exe Solr:solr-4.7.0.zip 注意:JDK 与 Tomcat 版本要对应,要么都是32位版本,要么都是64位版本,否则会报异常. 二.Solr安装 1.解压solr的zip安装包: 2.将dist文件夹中的solr-4…
Solr学习笔记之5.Component(组件)与Handler(处理器)学习 一.搜索篇 拼写检查(spellCheck) 作用:用来检查用户输入的检索内容是否存在,如果不存在则给它提示出相近或相似的内容 配置:在solrconfig.xml中配置如下 <searchComponent name="spellcheck" class="solr.SpellCheckComponent"> <lst name="spellchecker&…
Solr学习笔记之4.Solr配置文件简介 摘自<Solr in Action>. 1. solr.xml – Defines one or more cores per Solr server2. solrconfig.xml – Defines the main settings for a specific Solr core3. schema.xml – Defines the structure of your index including fields and field typ…
solr学习笔记 1.安装前准备 solr依赖java 8 运行环境,所以我们先安装java.如果没有java环境无法启动solr服务,并且会看到如下提示: [root@localhost solr-6.1.0]# ./bin/solr start -e cloud -noprompt /*运行solr服务*/ Java not found, or an error was encountered when running java. A working Java 8 is required t…
做了3年的Unity, 现在开始转入到做UE4,一来就进入一个超大项目组中学习,度过了最初2个月的生涩和紧张后,现在准备开始慢慢总结,慢慢学习,逐步深入理解和研究UE. 做了3年的游戏开发后,个人感悟最深的,就是非工作时候,是如何安排个人时间的.因为游戏开发的特殊性,大部分程序员都是在不断的被策划和PM追逐着去做各种功能,很少有时间去做自我研究.回顾过往的3年,个人感觉成长最快的,是负责项目相关框架搭建的时期,这时候没有具体的任务需求,可以全心的投入到相关功能的设计,开发,迭代,进一步优化中.…
上一篇我们初识了Solr而且学习了Jetty的启动方式.查看了Solr的管理界面,这一篇我们来实如今Tomcat上部署执行Solr. 部署环境: window7 jdk1.6.0_14 Solr-4.7.2 tomcat-6.0.37 Solr的安装配置Solr home .主要介绍基于JNDI的配置.其他方式能够參考Solr的wiki. 基于JNDI配置 1:首先建立一个Solr的执行文件夹. C:\solr-tomcat 将解压缩包中的D:\work\work-tools\solr\solr…
已经快30岁了,中专学历,不会什么技术,因为好吃懒做最喜欢的就是吃肉睡觉. 每次想学习技术如PhotoShop,绘声绘影,PHP,易语言,按键精灵都只是3分钟热血. 今天我想在业余时间学习Python,在博客园记录学习的重点笔记,立下Flag,一定要改变自己. 用了大概一个星期的时间学习了3天金角大王的Python的全栈开发的前三课. 回忆如下: 2.x = 默认编码 =ASSIC =不支持3.x = 默认编码 =UNICODE =默认支持中文 python 3 vs 2 1. 默认支持中文 2…
下载压缩包http://archive.apache.org/dist/lucene/,解压后放到某一盘符下面 Windows下启动命令 :\solr-7.2.0>bin\solr.cmd start -e cloud成功启动后,请用solr提供学习的例子,在控制台输入techproducts 然后回车, 然后创建分片和副本,可以直接Enter跳过,默认分2个分片和副本. Solr有两个开箱即用的配置文件样本集,称为"configSet".而索引集合必须有一个"Conf…
学习Solr前需要有Lucene的基础 Lucene的一些简单用法:https://www.cnblogs.com/dddyyy/p/9842760.html 1.部署Solr到Tomcat(Windows) Solr自带小型服务器jetty,但在我们开发环境中,习惯使用Tomcat,所以把Solr部署到Tomcat上(Tomcat 8.0以上,jdk 1.8以上) 其实步骤相同,但在windows配置要方便一些,所以第一次还是使用Windows来部署. 1.1 准备工作 Solr下载地址:ht…
目录 前言 linux部署 使用 配置 使用 前言 solr是apach基于Lucene开发的成熟的框架,这里我们学习如何部署.使用.关于集群会在后面继续添加 linux部署 mkdir /usr/local/solr && cd /usr/local/solr # 把tomcat.solr和IK分词器复制到当前目录 wget http://archive.apache.org/dist/lucene/solr/4.10.3/solr-4.10.3.tgz wget http://124.…
从大一开始学习C语言,大学期间做了许多嵌入式的开发项目,毕业后从事嵌入式开发工作主要的开发语言也是C语言.虽然期间断断续续的学习过C++,做过QT.C#上位机但也只是在其他语言的外壳下使用C在开发,始终没有好好的学习C++,一遇到C++就犯怂,看着代码似懂非懂的感觉. 秉承着“不会C++的程序猿不是合格的猴子”的信念(自己瞎掰),趁着目前有空闲的时间下定决心好好的学习C++,不求精通但求以后遇到需要C++开发的项目可以很快上手,不再犯怂.想想能自己用C++做一些好玩的软件就有点小兴奋...因此写…
最近准备为一个产品做一个站内的搜索引擎,是一个java产品.由于原来做过Lucene.net,所以自然而然的就想到了使用Lucene.在复习Lucene的过程中发现了Solr这个和Lucene绑定在一起的Apache的子项目,发现这个搜索服务器正是我们想要的.原来我们做Lucene,会把索引和搜索都放在同一个网站下,也就是在网站启动的时候,或定时在网站应用程序中进行Lucene的初始化和索引,并使用Lucene搜索API提供搜索服务.这个过程,应用网站既提供了搜索内容的提供者(从数据库或文件提取…
在上一节中我们已经成功部署和运行了一个solr应用,那么我们就可以通过这个正在运行的solr来创建一些文档,并进行搜索. 首先介绍一下core这个概念,core在solr中类似与关系型数据库中一张表的概念,在core中存放着结构化的数据用于查询,现在我们创建一个core 创建core的方式有三种: 通过web管理页面来创建页面 通过solr命令行创建 通过restful风格的url请求来创建 由于前两种创建的方式的实质也是调用url请求,因此这里我们采用第三种,直接在浏览器中请求url来创建co…
今天开始学习markdown,立贴为证. 平均一天一小时.两个月先学完基础. 所有的帖子只为了学习记录,有不对的请提出,轻吐槽…
学而不思则罔,思而不学则殆,总是看文档不动手效果是不好的.没有实地的从自己的数据库获取数据测试一下始终是空,总结一下自己的操作步骤吧. 第一步准备配置文件 E:\Solr\server\solr\configsets\_default\conf放置一个数据结构文件db-data-config.xml,内容如下 <dataConfig> <dataSource driver="com.microsoft.sqlserver.jdbc.SQLServerDriver" u…
创建核心(帮助: solr create_core -help) 例子: solr create_core -c mjj_core -d /var/solr/mjj_config (-c 是核心名称 -d 是配置文件夹的拷贝源位置,会拷贝到solr_home的mjj_core文件夹下 这里我只是把/opt/solr-8.0.0/server/solr/configsets/_default文件夹下内容拷贝到了/var/solr/mjj_config,效果跟默认配置一样        /opt/s…
一 搜索引擎是什么一套可对大量结构化.半结构化数据.非结构化文本类数据进行实时搜索的专门软件最早应用于信息检索领域,经谷歌.百度等公司推出网页搜索而为大众广知.后又被各大电商网站采用来做网站的商品搜索.现广泛应用于各行业.互联网应用.是大型系统.网站架构师必备技能. 搜索引擎是用来解决什么问题的 专门解决大量结构化.半结构化数据.非结构化文本类数据的实时检索问题. 这种实时搜索数据库做不了. 搜索引擎适合什么场景使用? 大量结构化.半结构化.非结构化文本类数据的实时搜索 信息检索(如电子图书馆.…
1.导入JSON数据的方式有两种,一种是在web管理界面中导入,另一种是使用curl命令来导入 curl http://localhost:8983/solr/baikeperson/update/json?commit=true --data-binary @/home/XXX/下载/person/test1.json -H 'Content-type:text/json; charset=utf-8' 2.导入的时候注意格式 使用curl可以导入的格式 { "add": { &qu…
1.进入Solr管理界面http://localhost:8983/solr/ 可以看到Query中有若干的参数,其意义如下(参考:http://www.jianshu.com/p/3c4cae5dee8d) Solr的查询语法: Solr默认有三种查询解析器(Query Parser): Standard Query Parser DisMax Query Parser Extended DisMax Query Parser (eDisMax) 第一种是标准的Parser,最后一种是最强大的…
一.官方资源 1.官网:http://lucene.apache.org/solr/ 2.wiki:http://wiki.apache.org/solr/FrontPage 3.solr中文网:http://www.solrcn.com/ 4.solr中国:http://www.solr.cc/blog/ 二.精彩博客 1.天涯人的博客: http://blog.csdn.net/liuweitoo/article/details/8124440…
一. 问题描述:Solr在建立索引时候出现如下错误:org.apache.solr.common.SolrException: Document [null] missing required field: id 原因:主要是因为Solr 的solrconfig配置文件中定义了<uniqueKey>id</uniqueKey>,默认了ID 是唯一的.但是在solr建立索引的时候,你提交的doc中没有 id 这个Field,如果你的索引字段不需要ID,就可以把这个改掉. 解决方法:…
本文地址: http://zhoujianghai.iteye.com/blog/1540176 首先介绍一下solr: Apache Solr (读音: SOLer) 是一个开源.高性能.采用Java开发.基于Lucene的全文搜索服务器,文档通过Http利用XML加到一个搜索集合中,查询该集合也是通过 http收到一个XML/JSON响应来实现.Solr 中存储的资源是以 Document 为对象进行存储的.每个文档由一系列的 Field 构成,每个 Field 表示资源的一个属性.Solr…
前言 Solr/Lucene是一个全文检索引擎,全文引擎和SQL引擎所不同的是强调部分相关度高的内容返回,而不是所有内容返回,所以部分内容包含在索引库中却无法命中是正常现象.      多数情况下我们建议优化分词器或者引擎其它部分达到预期检索效果. 分词器调节 按照如下步骤进入分词器调试界面 1.选择collection 2.选择analysis菜单 3.在索引框中输入要索引的文档 4.在检索框中输入要检索的词语 5.选择需要调试的字段,这里假设要将内容索引到title字段,并且在该字段上检索…
一.Spring Data Solr简介 前面已经介绍了通过solrJ来操作solr,那么我们如何将Solr的应用集成到Spring中?Spring Data Solr就是为了方便Solr的开发所研制的一个框架,其底层是对SolrJ(官方API)的封装. 二.Spring Data Solr入门案例 2.1 搭建工程 (1)创建maven工程,pom.xml中引入依赖 <dependencies> <dependency> <groupId>org.springfram…
一.概述 1.1 什么是SolrCloud Lucene是一个Java语言编写的利用倒排原理实现的文本检索类库: Solr是以Lucene为基础实现的文本检索应用服务.Solr部署方式有单机方式.多机Master-Slaver方式.Cloud方式. SolrCloud(solr 云)是Solr提供的分布式搜索方案.当索引量很大,搜索请求并发很高,一个单一的系统无法满足磁盘需求,查询速度缓慢,此时就需要SolrCloud.在分布式索引中,原来的大索引,将会分成多个小索引,solr可以将这些小索引返…
一.什么是SolrJ solrj是访问Solr服务的java客户端,提供索引和搜索的请求方法,SolrJ通常嵌入在业务系统中,通过SolrJ的API接口操作Solr服务,如下图: 二.SolrJ的基本操作 2.1 添加文档 实现步骤: 第一步:创建一个java工程 第二步:导入相关jar包   第三步:和Solr服务器建立连接.HttpSolrServer对象建立连接 第四步:创建一个SolrInputDocument对象,然后添加域 第五步:将SolrInputDocument添加到索引库 第…