简单介绍一下solr?
  
  Solr是一个独立的企业级搜索应用服务器,它对外提供类似于web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过http Get操作提出查找请求,并得到XML格式的返回结果。
  
  特点:Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的 功能管理界面,是一款非常优秀的全文搜索引擎。
  
  工作方式:文档通过Http利用XML加到一个搜索集合中。查询 该集合也是通过http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提供一套强大Data Schema 来定义字段,类型和设置文本分析,提供基于Web的管理界面等。
  
  2.Solr怎么设置搜索结果排名靠前?
  
  可以设置文档中域的boost值,boost值越高,计算出来的相关度得分就越高,排名也就越靠前。此方法可以把热点产品或者推广商品的排名提高。 
  
  3.solr中lk分词器原理是什么?
  
  IK分词器的分词原理是词典分词。先在内存中初始化一个词典,然后在分词过程中挨个读取字符,和字典中的字符相匹配,把文档中的所有词语拆分出来的过程。
  
  1.2 搜索介绍
  
   1.2.1 传统搜索实现方案
  
  说明:根据用户输入的搜索 关键词(java),应用服务器通过SQL语句查询数据库,数据库服务器把查询结果响应给应用服务器,应用服务器把查询结果响应给用户。
  
  特点:用户量大,数据量大,数据库服务器的压力很大,查询速度慢!!!
  
   1.2.2 Lucene实现方案
  
  说明:根据用户输入的搜索 关键词(java),应用服务器通过Lucene的API搜索索引库,索引库把搜索结果响应到应用服务器,应用服务器再把搜索结果响应给用户。
  
  特点:解决用户量大,数据量很大,系统 对搜索速度要求高的业务需求(实时查询)。
  
  1.3 数据查询方法
  
   1.3.1 顺序扫描法
  
  举个例子:比如我们有大量的文件,文件编号从A,B,C。。。。。。
  
  需求:要找出文件内容中包含有java的所有文件
  
  需求实现:从A文件开始查找,再找B文件,然后再找C文件,以此类推。。。。。
  
  特点:如果文件数量很多,查找速度慢!!!
  
  1.3.2 倒排索引法
  
  举个例子:使用新华字典查找汉字,先找到汉字的偏旁部首,再根据偏旁部首对应的目录(索引)找到目标汉字。
  
  以lucene为例建立倒排索引:
  
  文件一(编号0):we like java java java
  
  文件二(编号1):we like lucene lucene lucene
  
  说明:
  
  建立倒排索引,就是建立词语与文件的对应关系(词语在什么文件出现,出现了几次,在什么位置出现)。
  
  搜索的时候,直接根据搜索关键词(java),在倒排序中找到目标内容。 
  
  1.4 搜索技术应用场景
  
   单机软件搜索(idea)
  
  站内搜索(京东、淘宝)
  
  垂直搜索(限定行业,比如教育,医疗搜索)
  
  平台搜索(百度,360,搜狗)
  
  2. Lucene介绍
  
  2.1 Lucene是什么
  
  Lucene是apache软件基金会下的一个子项目。是一个成熟、免费、开放源代码的全文检索引擎工具包。提供了一套简单易用的API,方便在目标系统中实现全文检索功能。目前已经有很多应用系统的搜索功能是基于lucene来实现。比如eclipse帮助系统的搜索功能。
  
  Lucene能够为文本类型的数据建立索引,只需要把数据转换成文本格式,lucene就可以对文档进行索引和搜索。比如常见的word文档、html文档、pdf文档。首先将文档内容转换成文本格式,交给lucene进行索引,把建立好的索引保存在硬盘或者内存中。然后根据用户输入的查询条件,在索引文件中查找,返回查询结果给用户。
  
  2.2 全文检索是什么
  
   索引流程:计算机通过索引程序扫描文件中的每一个词语,建立词语与文件的对应关系。
  
  检索流程:计算机通过检索程序,根据搜索关键词,在索引库查找目标内容。
  
  select * from table where 。。。
  
  table字段Num有0和1两种值
  
  当参数@Type的值为0时,查询所有记录(包括0和1)
  
  当参数@Type的值为1时,查询Num为0的记录
  
  当参数@Type的值为2时,查询Num为1的记录
  
  方案1:
  
  declare int @Type
  
  select * from table where CASE WHEN @Type=www.furong157.com 0 THEN num WHEN @Type=1 THEN 0 ELSE 1 END = NUM
  
  方案2:
  
  USE tempdb
  
  GO
  
  IF OBJECT_ID('t'www.michenggw.com/) IS NOT NULL DROP TABLE t
  
  GO
  
  CREATE TABLE t(
  
  id INT IDENTITY(1,www.leyouzaixian2.com) PRIMARY KEY,
  
  Num INT
  
  )
  
  GO
  
  INSERT INTO t(Num) VALUES (www.yigouyule2.cn );
  
  INSERT INTO t(Num) VALUES (www.xycheng178.com);
  
  INSERT INTO t(Num) VALUES (www.huarenyl.cn);
  
  INSERT INTO t(Num) VALUES (www.hjshidpt.com);
  
  GO
  
  --- 以上为测试表及测试数据 ----
  
  --下面的写法,也许不算简洁,但足够清晰,如果有更多的情况,要扩展也非常容易
  
  DECLARE @Type INT
  
  SET @type=1
  
  select * from t where Num IN (
  
  SELECT [Num] FROM (
  
  VALUES
  
  (0,0) --当参数@Type的值为0时,查询所有记录(包括0和1)
  
  ,(0,1)
  
  ,(1,0) --当参数@Type的值为1时,查询Num为0的记录
  
  ,(2,1) --当参数@Type的值为2时,查询Num为1的记录
  
  ) AS T([Type],[Num])
  
  WHERE [Type]=@Type
  
  )
  
  /*
  
  id Num
  
  ----------- -----------
  
  2 0
  
  4 0
  
  (2 行受影响)
  
  */
  
  --或者
  
  select * from t where Num IN (
  
  SELECT [Num] FROM (
  
  SELECT 0 AS [Type],0 AS [Num] --当参数@Type的值为0时,查询所有记录(包括0和1)
  
  UNION ALL SELECT 0,1
  
  UNION ALL SELECT 1,0 --当参数@Type的值为1时,查询Num为0的记录
  
  UNION ALL SELECT 2,1 --当参数@Type的值为2时,查询Num为1的记录
  
  ) AS T
  
  WHERE [Type]=@Type
  
  )
  
  /*
  
  id Num
  
  ----------- -----------
  
  2 0
  
  4 0
  
  (2 行受影响)

简单介绍一下solr?的更多相关文章

  1. Phoenix(sql on hbase)简单介绍

    Phoenix(sql on hbase)简单介绍 介绍: Phoenix is a SQL skin over HBase delivered as a client-embedded JDBC d ...

  2. Solr系列一:Solr(Solr介绍、Solr应用架构、Solr安装使用)

    一.前言 前面已经学习了Lucene的分词.索引详解.搜索详解的知识,已经知道开发一个搜索引擎的流程了.现在就会有这样的一个问题:如果其他的系统也需要使用开发的搜索引擎怎么办呢?这个时候就需要把开发的 ...

  3. Python常用的库简单介绍一下

    Python常用的库简单介绍一下fuzzywuzzy ,字符串模糊匹配. esmre ,正则表达式的加速器. colorama 主要用来给文本添加各种颜色,并且非常简单易用. Prettytable ...

  4. 【Hadoop离线基础总结】Hue的简单介绍和安装部署

    目录 Hue的简单介绍 概述 核心功能 安装部署 下载Hue的压缩包并上传到linux解压 编译安装启动 启动Hue进程 hue与其他框架的集成 Hue与Hadoop集成 Hue与Hive集成 Hue ...

  5. [原创]关于mybatis中一级缓存和二级缓存的简单介绍

    关于mybatis中一级缓存和二级缓存的简单介绍 mybatis的一级缓存: MyBatis会在表示会话的SqlSession对象中建立一个简单的缓存,将每次查询到的结果结果缓存起来,当下次查询的时候 ...

  6. 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍

    一.pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析.它提供了大量高级的数据结构和对数据处理的方法. pandas 有两个主要的数据结构 ...

  7. 利用Python进行数据分析(4) NumPy基础: ndarray简单介绍

    一.NumPy 是什么 NumPy 是 Python 科学计算的基础包,它专为进行严格的数字处理而产生.在之前的随笔里已有更加详细的介绍,这里不再赘述. 利用 Python 进行数据分析(一)简单介绍 ...

  8. yii2的权限管理系统RBAC简单介绍

    这里有几个概念 权限: 指用户是否可以执行哪些操作,如:编辑.发布.查看回帖 角色 比如:VIP用户组, 高级会员组,中级会员组,初级会员组 VIP用户组:发帖.回帖.删帖.浏览权限 高级会员组:发帖 ...

  9. angular1.x的简单介绍(二)

    首先还是要强调一下DI,DI(Denpendency Injection)伸手获得,主要解决模块间的耦合关系.那么模块是又什么组成的呢?在我看来,模块的最小单位是类,多个类的组合就是模块.关于在根模块 ...

随机推荐

  1. 解决 Cocos2d-x 3.2 error C1041: 无法打开程序数据库vc120.pdb

    单个项目解决方案 解决方案是为项目添加 /FS (Force Synchronous PDB Writes) 编译选项,具体位置在: 一劳永逸的解决方案 直接修改cocos的项目模板templates ...

  2. Objective-C Operators and Expressions

    What is an Expression? The most basic expression consists of an operator, two operands and an assign ...

  3. android 从contentView中删除view

    1. ((ViewGroup)view.getParent()).removeView(view) 2. ViewGroup rootView = (ViewGroup) this.findViewB ...

  4. nagios的一些东西

    make install 用来安装nagios的主程序,cgi和html文件 make install-init 在/etc/rc.d/init.d目录下创建nagios启动脚本 make insta ...

  5. 洛谷 P1311 选择客栈

    题目描述 丽江河边有n 家很有特色的客栈,客栈按照其位置顺序从 1 到n 编号.每家客栈都按照某一种色调进行装饰(总共 k 种,用整数 0 ~ k-1 表示),且每家客栈都设有一家咖啡店,每家咖啡店均 ...

  6. COGS 615. 韩国明星

    [问题描述] 在LazyCat同学的影响下,Roby同学开始听韩国的音乐,并且越来越喜欢H.o.T,尤其喜欢安七炫和Tony,可是,爱学习爱思考的Roby同学想,如果以后喜欢的韩星越来越多怎么办呢?R ...

  7. 快学UiAutomator创建第一个实例

    工具准备 一.准备好java环境(JDK)和安卓环境(SDK.ADT)jdk1.6+ \eclipse\SDK \ADT详情百度,安装java环境 二.打开eclipse 三.创建步骤: 右键新建== ...

  8. C++值传递、引用传递和指针传递

    #include<iostream> using namespace std; //值传递 void change1(int n){ cout<<"值传递--函数操作 ...

  9. Luogu P1782 旅行商的背包

    题目传送门 卡常背包果然名不虚传 算法主体就是两种背包分开跑,先跑多重背包,再跑奇货 不知道为什么,这题二进制拆分好像要比单调队列优化快一些 然后这题毒瘤的地方就出来了: 如果一件物品的体积\(\ti ...

  10. 移动网页端HTML5 meta便签

    width = device-width:标识宽度是设备屏幕的宽度 initial-scale = 1.0 :标识初始的缩放比例 minimum-scale =0.5 :表示最小的缩放比例 maxim ...