Solr 文章集成

  1. solr原理

    1. solr wiki: http://wiki.apache.org/solr/
    2. 分布式全文检索系统SolrCloud简单介绍 http://my.oschina.net/004/blog/175768
    3. collection,shard。core,leader,replica
    4. solr组件图。http://www.solr.cc/blog/?

      attachment_id=106

    5. 索引组件,检索组件:solrconfig配置
    6. 流水线各组件,schema.xml配置
    7. 数据导入时,先更新到leader再同步到replica
    8. solr数据提交分为两种,软提交和硬提交,是否开启随时提交在solrconfig中配置
    9. solr机群的机器数量最好提前规划
  2. 构建索引分词
    1. Solr之中文分词。 http://blog.csdn.net/zhu_tianwei/article/details/46711511
    2. 在schema.xml中配,在相关wiki中非常具体
    3. 配置同义词词典,停用词词典,扩展词词词典,查询&索引,停用词。同义词filter等。

      from=y1.7-2">http://v.youku.com/v_show/id_XNTgwODU4MTgw.html?from=y1.7-2

  3. query分词。
    1. 分词叫做analyzer
    2. Solr 使用自己定义 Query Parser

      http://blog.chenlb.com/2010/08/solr-use-custom-query-parser.html
  4. 查询參数。
    1. Solr查询具体解释http://www.cnblogs.com/johnwood/p/3449118.html
    2. Solr 使用自己定义 Query Parser. http://www.jisu3d.com/2010/0526/22459.html
  5. 查询结果排序。

    Ranked retrieval

    1. 全然匹配排在首位 http://chenzhenianqing.cn/articles/888.html
    2. Solrj 排序样例汇总。http://blog.sina.com.cn/s/blog_4d58e3c00101h5xc.html
    3. Solr搜索的排序打分规则探讨 http://elastos.org/redmine/boards/23/topics/348
    4. Solr设定不同字段的权重,依据相关度和业务字段综合排序搜索

      http://outofmemory.cn/java/solr/search-function-query-effect-result-order
    5. Solr In Action 笔记(2) 之评分机制(类似性计算) http://www.cnblogs.com/rcfeng/p/4067896.html
  6. 相关搜索。Spell-checking

    1. solr 百度相关搜索类似功能的实现 http://www.sxt.cn/u/2715/blog/4240
    2. Solr搜索配置关联词synonyms。 http://my.oschina.net/baowenke/blog/104019
    3. 小试 solr 的 spellcheck。

      http://blog.chenlb.com/2009/02/try-solr-spellcheck.html

      8.solr3.4 高亮(highlight),拼写检查(spellCheck),匹配类似(moreLikeThis) 应用实践 http://bastengao.iteye.com/blog/1197651

    4. http://yingbin920.iteye.com/blog/1568769
  7. 结果高亮
    1. solr学习笔记四:了解solr查询语法。http://www.guoweiwei.com/archives/830,也是通过文件进行配置。
    2. 高亮及自己主动完毕。

      url=13c4goagyCTBruYgYAmsoTmG-72D6dgr5bL20wDTyduZPtvyZaBCyTKkx9bZMFQtHZTYq5JieecTK6JNfVnxZ_Ri6YWMG85Nzs8A4vRD7Sa">http://wenku.baidu.com/link?url=13c4goagyCTBruYgYAmsoTmG-72D6dgr5bL20wDTyduZPtvyZaBCyTKkx9bZMFQtHZTYq5JieecTK6JNfVnxZ_Ri6YWMG85Nzs8A4vRD7Sa

  8. Faceting
  9. Autosuggest
  10. 结果统计Stats,url參数中。添加stats=true
  11. More Like This component,类似文档搜索。
  12. Debug component。debug模式开启,查看返回结果具体參数。&debugQuery=true。

  13. solr cloud
    1. solr在初始化一个collection的时候,能够设置好sharedNumber,Shard Splitting,在shared保存文档达到阈值,或接收到API的命令。能够split为多个。
    2. shared split:http://host:port/solr/admin/collections?collection=[your_collection_name]&shard=[shard_name]&action=SPLITSHARD
  14. Cache及冷启动
    1. Solr缓存 http://www.solr.cc/blog/?p=999
    2. Filter Cache http://www.solr.cc/blog/?p=239
    3. 改进Solr性能 http://blog.csdn.net/zhangshuliai/article/details/8022547
  15. SolrJ演示样例
    1. 数据入库方式优化:

      p=96">http://www.solr.cc/blog/?p=96

    2. SolrJ查询演示样例 http://www.solrtutorial.com/solrj-tutorial.html
    3. http://www.solr.cc/blog/?p=1296
  16. 使用solr的系统。

    1. 简单搜索系统组成总结

      http://www.wklken.me/posts/2014/06/09/search-system.html
    2. 使用 Apache Solr 实现更加机灵的搜索,第 1 部分: 基本特性和 Solr 模式 http://www.ibm.com/developerworks/cn/java/j-solr1/
  17. 文档资料

    1. csdn pdf: http://www.csdn.net/tag/solr
    2. 优酷资料: http://i.youku.com/solrcn
  18. solr配置文件

    1. schema.xml: solr的实例,有多少字段。每一个字段是什么类型,每一个字段怎样分词。

      http://wiki.apache.org/solr/SchemaXml

    2. solrconfig:索引的配置,缓存用多大,哪些地方用缓存,用哪些检索的分析器。

      http://wiki.apache.org/solr/SolrConfigXml

  19. 性能调优

    1. Solr 性能因素 http://www.solr.cc/blog/?p=58
    2. Solr调优參考 http://itindex.net/detail/40572-solr
    3. solr性能调优(taobaoer推荐)http://xiaoyezi1128.iteye.com/blog/560685
    4. Solr调优參考 http://www.blogjava.net/conans/articles/379550.html
    5. Solr调优參考(三篇)

      http://itindex.net/detail/37725-solr
    6. 假设一个分片的全部机器都宕机了,是会报异常的,假设不想报异常查询參数加上params.setParam(“shards.tolerant”, true)
    7. Solr优化官方文档,http://blog.csdn.net/babydavic/article/details/8701327
  20. jvm配置

    1. 參考solr in action第12章。要配置执行堆栈大小上下限以及垃圾回收參数。
  21. solr query日志挖掘
    1. 关于搜索挖掘所想

      p=2110">http://jm-blog.aliapp.com/?

      p=2110

.

Solr 文章集成的更多相关文章

  1. Solr学习笔记之2、集成IK中文分词器

    Solr学习笔记之2.集成IK中文分词器 一.下载IK中文分词器 IK中文分词器 此文IK版本:IK Analyer 2012-FF hotfix 1 完整分发包 二.在Solr中集成IK中文分词器 ...

  2. Solr04 - 在Jetty和Tomcat上部署Solr单机服务

    目录 1 准备安装环境 2 通过内部Jetty服务器启动 3 通过配置Tomcat服务器启动 3.1 删除不需要的应用 3.2 修改服务端口 3.3 部署solr.war 3.4 扩展: 虚拟目录发布 ...

  3. Solr In Action 中文版 第一章(四、五)

    1.1             功能概览1. 4 最后,让我们再依照以下的分类.高速的过一下Solr的主要功能: ·用户体验 ·数据建模 ·Solr 4的新功能 在本书中.为你的用户提供良好的搜索体验 ...

  4. 威胁预警|Solr velocity模板注入远程命令执行已加入watchbog武器库,漏洞修补时间窗口越来越短

    概述 近日,阿里云安全团队监测到挖矿团伙watchbog更新了其使用的武器库,增加了最新Solr Velocity 模板注入远程命令执行漏洞的攻击方式,攻击成功后会下载门罗币挖矿程序进行牟利.建议用户 ...

  5. solr +zookeeper+tomcat 集群搭建

    最近需要搭建一个cloudSolr集群,写下记录.基础环境是在centos6.5 64bit 3个下载地址: 1. 下载Solr-4.x http://lucene.apache.org/solr/d ...

  6. Solr调研总结

    http://wiki.apache.org/solr/ Solr调研总结 开发类型 全文检索相关开发 Solr版本 4.2 文件内容 本文介绍solr的功能使用及相关注意事项;主要包括以下内容:环境 ...

  7. solr教程,值得刚接触搜索开发人员一看

    http://blog.csdn.net/awj3584/article/details/16963525 Solr调研总结 开发类型 全文检索相关开发 Solr版本 4.2 文件内容 本文介绍sol ...

  8. Solr总结

    http://www.cnblogs.com/guozk/p/3498831.html Solr调研总结 开发类型 全文检索相关开发 Solr版本 4.2 文件内容 本文介绍solr的功能使用及相关注 ...

  9. 【转载】solr教程,值得刚接触搜索开发人员一看

    转载:http://blog.csdn.net/awj3584/article/details/16963525 Solr调研总结 开发类型 全文检索相关开发 Solr版本 4.2 文件内容 本文介绍 ...

随机推荐

  1. html前端如何将一个页面表单内的数据全部传递到另一个页面?

    http://blog.csdn.net/stone_tomcate/article/details/64148648?winzoom=1

  2. 环境变量HISTCONTROL命令及对快捷键Ctrl+o命令的影响

    在linux中环境变量HISTCONTROL可以控制历史的记录方式. HISTCONTROL有以下的选项: ignoredups          默认,忽略重复命令 ignorespace      ...

  3. Linux的硬件时间、校正Linux系统时间及系统时间调用流程

    第一部分: 一)概述: 事实上在Linux中有两个时钟系统,分别是系统时间和硬件时间 UTC是协调世界时(Universal Time Coordinated)英文缩写,它比北京时间早8个小时.   ...

  4. 快速简单高效的搭建 SolrCloud 集群

    转https://segmentfault.com/a/1190000008634902 集群配置 集群中的每台机器都要按照以下说明进行配置启动 首先到 solr 安装目录的 bin 下,编辑 sol ...

  5. 洛谷 P1434 [SHOI2002]滑雪

    这道题适合记忆化练手 毕竟总有些大佬虐题. 这个题有几个剪枝 1.记忆化 这个不用多说了吧 剪枝就是 如果 当前点到下面一个点的目前下降的高度+1 小于 下面那个点 能下降的高度 那么反过来,这个点不 ...

  6. Jmeter用于接口测试中,关联如何实现

    Jmeter用于接口测试时,后一个接口经常需要用到前一次接口返回的结果,应该如何获取前一次请求的结果值,应用于后一个接口呢,拿一个登录的例子来说明如何获取. 1.打开jmeter, 使用的3.3的版本 ...

  7. BNU 4346 Scout YYF I

    A. Scout YYF I Time Limit: 1000ms Memory Limit: 65536KB 64-bit integer IO format: %lld      Java cla ...

  8. PHP加速之eaccelerator

    eaccelerator简介: eAccelerator是一个自由开放源码php加速器,优化和动态内容缓存,提高了php脚本的缓存性能,使得PHP脚本在编译的状态下,对服务器的开销几乎完全消除. 它还 ...

  9. 校第十六届大学生程序设计竞赛暨2016省赛集训队选拔赛(Problem E)

    Problem E Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) Total ...

  10. 洛谷P1521 求逆序对 题解

    题意: 求1到n的全排列中有m对逆序对的方案数. 思路: 1.f[i][j]表示1到i的全排列中有j对逆序对的方案数. 2.显然,1到i的全排列最多有(i-1)*i/2对逆序对,而对于f[i][j]来 ...