这篇博客含有海量资料,学习solr必备字典 
大概看完solr就基本上手了。 
solr原味资料:http://wiki.apache.org/solr/FrontPage 
( 
    http://wiki.apache.org/solr/QueryParametersIndex 
    http://wiki.apache.org/solr/SchemaXml 
    http://wiki.apache.org/solr/CoreAdmin 
    http://wiki.apache.org/solr/ExtractingRequestHandler 
    http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters 
    http://wiki.apache.org/solr/LanguageAnalysis 
    http://wiki.apache.org/solr/DataImportHandler#Overview 
    http://wiki.apache.org/solr/Solrj 
    http://wiki.apache.org/solr/SolrQuerySyntax 
) 
solr咀嚼资料一(如联接消失可下载附件):http://clayz.iteye.com/blog/240366 
solr咀嚼资料二:http://www.ibm.com/developerworks/cn/java/j-solr1/#basics 
solr咀嚼资料三:http://www.ibm.com/developerworks/cn/java/j-solr-update/index.html 
solr咀嚼资料四(多核(MultiCore)配置  ):http://aixiangct.blog.163.com/blog/static/9152246120111128114423633/ 
slor咀嚼资料五(几个solr高手):http://blog.csdn.net/aidayei/article/category/829139 
http://blog.chenlb.com/category/solr-search 
http://lianj-lee.iteye.com/category/71985 
http://passover.blog.51cto.com/2431658/568972 
http://wutaoo.iteye.com/category/58704?show_full=true 
http://blognojava.iteye.com/blog/1187996

DataImportHandler的译文:http://mxsfengg.blog.163.com/blog/static/26370218200810250524813/

讲的较没用,但很深的:http://liuxinglanyue.iteye.com/category/133220

solr源码分析: 
http://www.cnblogs.com/mandela/archive/2011/05/10/2041753.html

solr讲的不错的solr高级配置:http://hi.baidu.com/mutourenoo/blog/item/63f430359ac23282a71e1269.html

solr.solr.home的配置和理解: 
配置的是程序主目录,程序根据这个目录查找源文件,如System.setProperty("solr.solr.home", "./");源码分析中有介绍:http://www.cnblogs.com/mandela/archive/2011/05/10/2041753.html

在index页面在赋予下面多索引的链接。方法如下 
<% 
  org.apache.solr.core.CoreContainer cores = (org.apache.solr.core.CoreContainer)request.getAttribute("org.apache.solr.CoreContainer");
  if( cores != null 
   && cores.getCores().size() > 0 // HACK! check that we have valid names... 
   && cores.getCores().iterator().next().getName().length() != 0 ) { 
    for( org.apache.solr.core.SolrCore core : cores.getCores() ) {%> 
<a href="<%= core.getName() %>/admin/">Admin <%= core.getName() %></a><br/> 
<% }} else { %> 
<a href="admin/">Solr Admin</a> 
<% } %>

建议建立了一个拷贝字段,将所有的全文字段复制到一个字段中,以便进行统一的检索: 
<field name="all" type="text" indexed="true" stored="false" multiValued="true"/>  
并在拷贝字段结点处完成拷贝设置: 
Xml代码  
<copyField source="name" dest="all"/>  
<copyField source="summary" dest="all"/>

defaultSearchField 
可以将某个Field设置为defaultSearchField,当没有明确的查询Field的时候,来查询这个Filed,该Filed一般设置为multiValued,copyField多个Filed

Solr Multicore 是 solr 1.3 的新特性。其目的一个solr实例,可以有多个搜索应用。 
在solr.xml中配置,如: 
<?xml version="1.0" encoding="UTF-8" ?>    
    <solr persistent="false">      
      <cores adminPath="/admin/cores">    
        <core name="core0" instanceDir="core0" />    
        <core name="core1" instanceDir="core1" />    
      </cores>    
</solr> 
instanceDir是solr.home,即core0,core1索引资源文件所在的路径 
name是solr请求的路径,如http://localhost:8393/core0/admin/可进入core的admin页面,
solrj可以用http://localhost:8393/core0/..对该索引请求操作

ExtractingRequestHandler是文件提取,可用于word、pdf等文件提取 
可参考http://xinyangwjb.iteye.com/admin/blogs/1405676

中文分词采用lucene自带的CjkAnalyzer分词: 
http://lianj-lee.iteye.com/blog/519254 
http://blog.csdn.net/cnhome/article/details/5543308 
采用cjk有俩原因,一、我使用的solr的版本只有1.4.0,lucene的版本也只有2.9.1,自带的中文分析器只有cjk。 
二、cjk不用引入外部的jar报和字典库,简单,快~~

UniqueKey的问题: 
默认是有这个属性的,也可以没有,如果有UniqueKey,add的时候,会先看该UniqueKey是否存在,如果存在则覆盖,不存在则新增

对于DateField的查询: 
日期格式的字段的查询很恶心,必须是UTC格式,并且效率低下,建议是先将date字段转化为int或者long再存入索引。http://wiki.apache.org/solr/SolrQuerySyntax

solr学习一(一大堆的学习资料)的更多相关文章

  1. (转)深度学习(Deep Learning, DL)的相关资料总结

    from:http://blog.sciencenet.cn/blog-830496-679604.html 深度学习(Deep Learning,DL)的相关资料总结 有人认为DL是人工智能的一场革 ...

  2. TCP/IP协议学习之实例ping命令学习笔记

    TCP/IP协议学习之实例ping命令学习笔记(一) 一. 目的为了让网络协议学习更有效果,在真实网络上进行ping命令前相关知识的学习,暂时不管DNS,在内网中,进行2台主机间的ping命令的整个详 ...

  3. 学习《零基础入门学习Python》电子书PDF+笔记+课后题及答案

    初学python入门建议学习<零基础入门学习Python>.适合新手入门,很简单很易懂.前一半将语法,后一半讲了实际的应用. Python3入门必备,小甲鱼手把手教授Python,包含电子 ...

  4. ElasticSearch 5学习(7)——分布式集群学习分享2

    前面主要学习了ElasticSearch分布式集群的存储过程中集群.节点和分片的知识(ElasticSearch 5学习(6)--分布式集群学习分享1),下面主要分享应对故障的一些实践. 应对故障 前 ...

  5. ElasticSearch 5学习(6)——分布式集群学习分享1

    在使用中我们把文档存入ElasticSearch,但是如果能够了解ElasticSearch内部是如何存储的,将会对我们学习ElasticSearch有很清晰的认识.本文中的所使用的ElasticSe ...

  6. JavaWeb学习总结(三)——Tomcat服务器学习和使用(二) 包含https 非对称秘钥 NB

    JavaWeb学习总结(三)--Tomcat服务器学习和使用(二) 一.打包JavaWeb应用 在Java中,使用"jar"命令来对将JavaWeb应用打包成一个War包,jar命 ...

  7. [原创]java WEB学习笔记75:Struts2 学习之路-- 总结 和 目录

    本博客的目的:①总结自己的学习过程,相当于学习笔记 ②将自己的经验分享给大家,相互学习,互相交流,不可商用 内容难免出现问题,欢迎指正,交流,探讨,可以留言,也可以通过以下方式联系. 本人互联网技术爱 ...

  8. [原创]java WEB学习笔记66:Struts2 学习之路--Struts的CRUD操作( 查看 / 删除/ 添加) 使用 paramsPrepareParamsStack 重构代码 ,PrepareInterceptor拦截器,paramsPrepareParamsStack 拦截器栈

    本博客的目的:①总结自己的学习过程,相当于学习笔记 ②将自己的经验分享给大家,相互学习,互相交流,不可商用 内容难免出现问题,欢迎指正,交流,探讨,可以留言,也可以通过以下方式联系. 本人互联网技术爱 ...

  9. (转) 基于Theano的深度学习(Deep Learning)框架Keras学习随笔-01-FAQ

    特别棒的一篇文章,仍不住转一下,留着以后需要时阅读 基于Theano的深度学习(Deep Learning)框架Keras学习随笔-01-FAQ

  10. java学习——java中的反射学习笔记

    Java--reflect 一.Class类的使用 什么是Class类? 1:在面向对象的世界中,万事万物皆对象. java语言中,静态的成员,普通数据类型类是不是对象呢? 是,对象!是类的对象! 类 ...

随机推荐

  1. php--------对象(object) 与 数组(array) 的转换

    php开发中常常用到数组,sql数据都是数组,数组和对象用的也是比较多的,常常相互转化,数组是PHP的灵魂,非常强大,面向对象编程也是挺方便的. /** * 数组 转 对象 * * @param ar ...

  2. 第二类斯特林数(转自http://www.cnblogs.com/gzy-cjoier/p/8426987.html )

    转自http://www.cnblogs.com/gzy-cjoier/p/8426987.html 侵删

  3. Sasha and a Very Easy Test CodeForces - 1109E (数学,线段树)

    大意: 给定n元素序列, q个操作: (1)区间乘 (2)单点除(保证整除) (3)区间求和对m取模 要求回答所有操作(3)的结果 主要是除法难办, 假设单点除$x$, $x$中与$m$互素的素因子可 ...

  4. mysql导出导入数据库表

    1.下载数据库 mysqldump db_name  -h 192.168.5.162 -uroot -p > /var/www/db_name.sql(这个可以自定义) 2,下载数据库中的某个 ...

  5. hdu-1892-二维BIT

    See you~ Time Limit: 5000/3000 MS (Java/Others)    Memory Limit: 65535/32768 K (Java/Others)Total Su ...

  6. 双机热备(准)-->RAC(夭折)-->DG(异地容灾)

    以下有的地方为oracle专业术语,非懂勿喷.前段时间某项目负责人告知,他们应用需要一套oracle数据库环境运行模式为双机热备.简单了解下对于现在已经非常成熟的RAC再合适不过了.详细问了问当前服务 ...

  7. 3n+1问题中的几个小的注意点

    3038 3n+1问题  时间限制: 1 s  空间限制: 32000 KB  题目等级 : 白银 Silver 题解       题目描述 Description 3n+1问题是一个简单有趣而又没有 ...

  8. IntelliJ IDEA 自动导入包 快捷方式 关闭重复代码提示

    idea可以自动优化导入包,但是有多个同名的类调用不同的包,必须自己手动Alt+Enter设置 设置idea导入包 勾选标注 1 选项,IntelliJ IDEA 将在我们书写代码的时候自动帮我们优化 ...

  9. oracle12c中新能优化新特性之热度图和自动数据优化

    1. Oracle12c热度图和自动数据优化 信息生命周期管理(ILM)是指在数据生命周期内管理它们的策略.依赖于数据的年龄和对应用的业务相关性,数据能被压缩,能被归档或移到低成本的存储上.简言之,I ...

  10. SSO-CAS单点登录

    基本概念 单点登录SSO ,是目前比较流行的企业业务整合的解决方案之一.SSO的定义是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统. CAS(Centeral Authenti ...