一、solr 的简单介绍

Apache Solr 是一个开源的搜索server。Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。Apache Solr 中存储的资源是以 Document 为对象进行存储的。

每一个文档由一系列的 Field 构成。每一个 Field 表示资源的一个属性。Solr 中的每一个 Document 须要有能唯一标识其自身的属性,默认情况下这个属性的名字是
id,在 Schema 配置文件里使用:<uniqueKey>id</uniqueKey>进行描写叙述。

  Solr是一个高性能,採用Java5开发。基于Lucene的全文搜索server。文档通过Http利用XML加到一个搜索集合中。

查询该集合也是通过 http收到一个XML/JSON响应来实现。它的主要特性包含:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性。提
供一套强大Data Schema来定义字段,类型和设置文本分析。提供基于Web的管理界面等。

二、solr 3.5 的下载

solr 3.5下载地址:http://www.apache.org/dist//lucene/solr/

tomcat  tomcat-7.0.26 下载:http://mirror.bjtu.edu.cn/apache/tomcat/tomcat-7/v7.0.26/bin/apache-tomcat-7.0.26.zip

三、solr 3.5的安装

1、解压tomcat-7.0.26 到 e:\tomcat-7.0.26\下

2、打开tomcat-7.0.26\conf 改动  server.xml 文件

  1. <Connector port="8080" protocol="HTTP/1.1"  connectionTimeout="20000"   redirectPort="8443" URIEncoding="UTF-8"/>
  1. <Connector port="8080" protocol="HTTP/1.1"  connectionTimeout="20000"   redirectPort="8443" URIEncoding="UTF-8"/>

改动默认port8080,能够不改动。加入字符编码  URIEncoding="UTF-8" 否则中文会乱码

3、在apache-solr-3.5.0\dist文件夹下找到apache-solr-3.5.0.war把重命名为solr.war 并上传到 tomcat-7.0.26/webapps下。

4、创建一个solr.xml文件。

在tomcat-7.0.14\conf\Catalina\localhost\下创建一个solr.xml文件。内容为:

  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <Context docBase="e:/tomcat-7.0.26/webapps/solr" debug="0" crossContext="true" >
  3. <Environment name="solr/home" type="java.lang.String" value="e:/tomcat-7.0.26/solr" override="true" />
  4. </Context>
  1. <?

    xml version="1.0" encoding="UTF-8"?>

  2. <Context docBase="e:/tomcat-7.0.26/webapps/solr" debug="0" crossContext="true" >
  3. <Environment name="solr/home" type="java.lang.String" value="e:/tomcat-7.0.26/solr" override="true" />
  4. </Context>

docBase:为solr的上传文件夹

5、把apache-solr-3.5.0\example文件夹下的solr文件夹上传到e:/tomcat-7.0.26文件夹下.索引文件会默认会放到 e:/tomcat-7.0.26\solr\data下.

6、又一次tomcat 在浏览器中输入:http://localhost:8080/

会出现:welcome to solr

solr admin  说明公布已成功!

四、solr 3.5与IKAnalyzer 3.2.8分词的整合

1、IKAnalyzer下载地址:IKAnalyzer 3.2.8

2、加入IKAnalyzer3.2.8.jar

把IKAnalyzer3.2.8.jar放到 tomcat-7.0.14\webapps\solr\WEB-INF\lib下;

3、schema.xml 添加信息

进入文件夹编辑schema.xml文件。在<Types>下加入下面内容:

  1. <fieldType name="text" class="solr.TextField" >
  2. <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
  3. <analyzer type="index">
  4. <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/>
  5. <filter class="solr.StopFilterFactory"
  6. ignoreCase="true" words="stopwords.txt"/>
  7. <filter class="solr.WordDelimiterFilterFactory"
  8. generateWordParts="1"
  9. generateNumberParts="1"
  10. catenateWords="1"
  11. catenateNumbers="1"
  12. catenateAll="0"
  13. splitOnCaseChange="1"/>
  14. <filter class="solr.LowerCaseFilterFactory"/>
  15. <filter class="solr.EnglishPorterFilterFactory"
  16. protected="protwords.txt"/>
  17. <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
  18. </analyzer>
  19. <analyzer type="query">
  20. <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/>
  21. <filter class="solr.StopFilterFactory"
  22. ignoreCase="true" words="stopwords.txt"/>
  23. <filter class="solr.WordDelimiterFilterFactory"
  24. generateWordParts="1"
  25. generateNumberParts="1"
  26. catenateWords="1"
  27. catenateNumbers="1"
  28. catenateAll="0"
  29. splitOnCaseChange="1"/>
  30. <filter class="solr.LowerCaseFilterFactory"/>
  31. <filter class="solr.EnglishPorterFilterFactory"
  32. protected="protwords.txt"/>
  33. <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
  34. </analyzer>
  35. </fieldType>
  1. <fieldType name="text" class="solr.TextField" >
  2. <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
  3. <analyzer type="index">
  4. <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/>
  5. <filter class="solr.StopFilterFactory"
  6. ignoreCase="true" words="stopwords.txt"/>
  7. <filter class="solr.WordDelimiterFilterFactory"
  8. generateWordParts="1"
  9. generateNumberParts="1"
  10. catenateWords="1"
  11. catenateNumbers="1"
  12. catenateAll="0"
  13. splitOnCaseChange="1"/>
  14. <filter class="solr.LowerCaseFilterFactory"/>
  15. <filter class="solr.EnglishPorterFilterFactory"
  16. protected="protwords.txt"/>
  17. <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
  18. </analyzer>
  19. <analyzer type="query">
  20. <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/>
  21. <filter class="solr.StopFilterFactory"
  22. ignoreCase="true" words="stopwords.txt"/>
  23. <filter class="solr.WordDelimiterFilterFactory"
  24. generateWordParts="1"
  25. generateNumberParts="1"
  26. catenateWords="1"
  27. catenateNumbers="1"
  28. catenateAll="0"
  29. splitOnCaseChange="1"/>
  30. <filter class="solr.LowerCaseFilterFactory"/>
  31. <filter class="solr.EnglishPorterFilterFactory"
  32. protected="protwords.txt"/>
  33. <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
  34. </analyzer>
  35. </fieldType>

然后在<fields>下加入:

  1. <field name="name1" type="text" indexed="true" stored="true" required="true" />
  1. <field name="name1" type="text" indexed="true" stored="true" required="true" />

5、又一次tomcat 在浏览器中输入:http://localhost:80/solr/analysis.jsp  进去 solr admin 显示:

solr 3.5 配置及server设置的更多相关文章

  1. Reporting Service 配置SMTP和设置订阅出现的异常

    SSRS能够按照schedule,以mail的形式发送report,这是通过设置subscription report来实现的. 1,发送mail需要在SSRS中配置SMTP Server,如果没有R ...

  2. 配置SQL Server去使用 Windows的 Large-Page/Huge-Page allocations

    配置SQL Server去使用 Windows的 Large-Page/Huge-Page  allocations 目录表->页表->物理内存页 看这篇文章之前可以先看一下下面这篇文章 ...

  3. 配置sql server 2000以允许远程访问 及 连接中的四个最常见错误

    地址:http://www.cnblogs.com/JoshuaDreaming/archive/2010/12/01/1893242.html 配置sql server 2000以允许远程访问适合故 ...

  4. 配置SQL Server 2008 R2 Reporting Services

    记录如何在本地配置SQL Server 2008 R2 Reporting Services,笔者环境为Windows 7 64位 + SQL Server 2008 R2 一.准备工作 其实准备工作 ...

  5. Ubuntu配置ssh server

    SSH-Server配置指南 一.SSH简介 SSH (Secure Shell)是一个应用程序中提供安全通信的协议,通过SSH协议可以安全地访问服务器,因为SSH 具有成熟的公钥加密体系,在数据进行 ...

  6. 配置SQL Server 2008服务器

    怎么配置SQL Server 2008服务器_百度经验 http://jingyan.baidu.com/article/9faa7231a922c1473c28cb23.html 1.验证安装是否成 ...

  7. 第三篇——第二部分——第五文 配置SQL Server镜像——域环境SQL Server镜像日常维护

    本文接上面两篇搭建镜像的文章: 第三篇--第二部分--第三文 配置SQL Server镜像--域环境:http://blog.csdn.net/dba_huangzj/article/details/ ...

  8. Solr多核的配置

    Solr 多核(MultiCore)配置 Solr Multicore意义 Solr Multicore 是 solr 1.3 的新特性.其目的一个solr实例,可以有多个搜索应用.< xmln ...

  9. 第三篇——第二部分——第三文 配置SQL Server镜像——域环境

    原文:第三篇--第二部分--第三文 配置SQL Server镜像--域环境 原文出处:http://blog.csdn.net/dba_huangzj/article/details/28904503 ...

随机推荐

  1. setTimeout()与setInterval()方法区别介绍

    计时器setTimeout()和setInterval()两个都是js的计时功能的函数两个有些区别,下面为大家简单介绍下,希望对大家有所帮助   计时器setTimeout()和setInterval ...

  2. oracle的一知半解

    这里只讲第一次开发运用oracle数据库的.net程序遇到问题: 1.程序与oracle数据库在同一台的服务器,貌似设置好连接字符串就可以直接访问( 需要主要的问题: 字符串格式:Data Sourc ...

  3. String的format方法

    摘自:http://xiongzhenhui.iteye.com/blog/940416 http://blueram.iteye.com/blog/441683 一.常规类型.字符类型和数值类型的格 ...

  4. C++ 约瑟夫环

    约瑟夫环: 已知n个人(以编号1,2,3...n分别表示)围坐在一张圆桌周围.从编号为k的人开始报数,数到m的那个人出列:他的下一个人又从1开始报数,数到m的那个人又出列:依此规律重复下去,直到圆桌周 ...

  5. 趣味PAT--循环-19. 币值转换(20)

    One visible minute on the stage is attributed to ten years of invisible practice off the stage. &quo ...

  6. JavaScript中的类式继承和原型式继承

    最近在看<JavaScript设计模式>这本书,虽然内容比较晦涩,但是细品才发现此书内容的强大.刚看完第四章--继承,来做下笔记. 书中介绍了三种继承方式,类式继承.原型式继承和掺元类继承 ...

  7. JS函数与call()apply()详解

    JavaScript中的每个函数都是一个对象. 因为函数都是对象,它们有自己的属性和方法.我们可以把它们看作数据(data). 函数和方法的区别? 函数立足于它们自己(例如:alert()), 而方法 ...

  8. js常用 禁止F5 和右键

    document.oncontextmenu = function() {event.returnValue = false;} //右键 document.onkeydown = function( ...

  9. 微软SpeechRecognitionEngine

    API官网手册:http://msdn.microsoft.com/zh-cn/library/System.Speech.Recognition.SpeechRecognitionEngine(v= ...

  10. 无法将类型“System.Nullable`1”强制转换为类型“System.Object”。LINQ to Entities 仅支持强制转换 EDM 基元或枚举类型。

    在一个项目中使用LINQ和EF时出现了题目所示的异常,搜索了很多资料都找不到解决办法,主要是因为EF方面的知识欠缺. 先将情况记录如下,以供以后参考. 查询主要设计两张表,由外键关联: 在进行下面的查 ...