SharePoint 2013 搜索体系结构
博客地址:http://blog.csdn.net/FoxDave
本文参考自微软官方的Chart,记录一下,算是自己对这部分知识的总结。
Microsoft® SharePoint® Server 2013 中的搜索使用新组件进行了 重新设计,从而可帮助在单个服务器场内实现更大冗余,并可在多 个方向上进行扩展。搜索体系结构由协同工作以执行搜索操作的组 件和数据库组成。所有组件均位于应用程序服务器上,而所有数据 库均位于数据库服务器上。
索引和查询体系结构
索引和查询体系结构对搜索查询做出响应并提供搜索结果。它包括 索引组件、索引分区和查询处理组件,所有这些均可根据内容量、 查询量和性能要求来扩展。
爬网和内容处理体系结构
爬网和内容处理体系结构对内容进行爬网,处理内容,然后将内容 传入索引组件。它包括爬网组件、爬网数据库和内容处理组件。这 些组件可以根据爬网量和性能要求来扩展。
分析体系结构
分析体系结构提供搜索分析和使用率分析。它由分析处理组件、分 析报告数据库和链接数据库组成。
搜索管理
搜索管理运行与搜索相关的系统进程。搜索管理体系结构由搜索管 理组件及其相应的数据库组成。
搜索主要部署在SharePoint的应用程序服务器上,并在DB端配有相应的数据库,下面三张图展示了SharePoint服务器与搜索组件之间的关系。
最后我们来看一下SharePoint搜索中端到端的组件交互示意图:
爬网和内容处理
爬网和内容处理体系结构包括爬网组件、爬网数据库和内容处理组件。可以根 据爬网量和性能要求来扩展这两个组件。
1. 关于爬网组件
爬网组件负责对内容源进行爬网。它将已爬网项目 – 实际内容及其关联的元数据 – 传递到内容处理组件。
爬网组件调用与内容源进行交互的连接器或协议处理程序以检索数据。可部署多个爬网组件以同时爬网。
爬网组件使用一个或多个爬网数据库来暂时存储有关已爬网项目的信息并跟踪爬网历史记录。
A. 关于爬网数据库
爬网数据库包含有关已爬网项目的跟踪和历史详细信息。
此数据库存储的信息包括上次爬网时间、上次爬网 ID 和上次爬网期间的更新类型。
2. 关于内容处理组件
内容处理组件置于爬网组件与索引组件之间。它处理已爬网项目并将这些项目传入索引组件。
内容处理组件通过执行文档分析和属性映射之类的操作,将已爬网项目转换成可包含在搜索索引中的项目。
内容处理组件和查询处理组件均执行语言处理。内容处理期间的语言处理示例包括语言检测和实体提取。
内容处理组件将关于链接和URL的信息写入链接数据库。接下来,分析处理组件通过内容处理组件,将与这些链接和URL相关性相关的信息写入搜索索引。
索引和查询处理
索引和查询体系结构包括索引组件、索引分区和查询处理组件,所有这些均可根据内容量、查询量和性能要求来扩展。
4. 关于索引组件
索引组件是索引副本的逻辑表示。在搜索体系结构中,您必须为每个索引副本设置一个索引组件。
索引组件从内容处理组件接收已处理的项目,并将这些项目写入索引文件中。
索引组件从查询处理组件接收查询,并反过来提供结果集。
查询通过查询处理组件发送至索引副本。系统将传入查询路由至索引副本并对其进行负载平衡。
关于索引分区
索引分区是整个搜索索引的逻辑分区。搜索索引是所有索引分区的聚合。
搜索索引可在以下两个方向进行扩展:
索引副本可根据查询负载或容错需要在索引分区中添加。每个索引分区都包含一个或多个索引副本。在一个索引分区中,每个索引副本所含的信息相同。例如,在一个索引分区包含三个索引副本的服务器场中,每个索引副本为总查询的三分之一提供服务。
索引分区可添加用于处理增加的内容量。例如,在包含三个索引分区的服务器场中,每个索引分区均包含整个搜索索引的三分之一。
5. 关于查询处理组件
查询处理组件位于搜索前端与索引组件之间。
查询处理组件分析并处理搜索查询和结果。
查询处理组件和内容处理组件均执行语言处理。查询处理期间的语言处理示例包括分词和词干分解。
当查询处理组件收到来自搜索前端的查询时,它会分析并处理该查询,以尝试优化精度、重新调用和相关性。处理的查询随后被提交至索引组件。
索引组件将根据所处理查询的结果集返回至查询处理组件,后者又反过来处理该结果集,然后将其发送回搜索前端。
分析处理
分析体系结构包括分析处理组件、分析报告数据库和链接数据库。
3. 关于分析处理组件
分析处理组件分析已爬网项目(搜索分析)以及用户与搜索结果的交互方式(使用率分析)。它使用这些信息来提高搜索相关性,并创建搜索报告、建议和深层链接。
此组件将:
通过内容处理组件从所接收的项目中提取搜索分析信息(如链接、定位文本、与人员相关的信息、元数据等),并将这些信息存储在未处理的链接数据库中。
通过事件存储从前端提取使用率分析信息,如某个项目被查看的次数。
分析处理组件分析这两种类型的信息。分析结果随后被返回至要包含在搜索索引中的内容处理组件(使用部分更新)。此外,使用率分析结果存储在分析报告数据库中。
B. 关于链接数据库
链接数据库存储由内容处理组件提取的信息。此外,它还存储关于搜索点击率的信息;人们在搜索结果页单击搜索结果的次数。此信息在未处理的情况下存储。分析处理组件执行分析。
C. 关于分析报告数据库
分析报告数据库存储使用率分析的结果。
此外,分析报告数据库还存储来自不同分析的统计信息。SharePoint 使用这些信息创建显示不同统计信息的 Excel 报表。
搜索管理
搜索管理由搜索管理组件及其相应的数据库组成。
6. 关于搜索管理组件
搜索管理组件负责运行搜索所必需的一些系统进程。
此组件执行设置操作,即添加和初始化其他搜索组件的其他实例。
D. 关于搜索管理数据库
搜索管理数据库存储搜索配置数据,如拓扑、爬网规则、查询规则以及已爬网属性与托管属性之间的映射。
SharePoint 2013 搜索体系结构的更多相关文章
- SharePoint 2013 搜索SharePoint 特定列和特定文档(自己定义搜索)
SharePoint 2013 搜索SharePoint 特定列和特定文档 1,操作步骤和图例,因语言和版本号的不同 我尽量使用抓图方式. 2. In Central Administration, ...
- Sharepoint 2013搜索服务配置总结(实战)
分享人:广州华软 星尘 一. 前言 SharePoint 2013集成了Fast搜索,相对于以前版本搜索的配置有了一些改变,在安装部署Sharepoint 2013时可以选择默认创建搜索服务,但有时候 ...
- [转载]SharePoint 2013搜索学习笔记之搜索构架简单概述
Sharepoint搜索引擎主要由6种组件构成,他们分别是爬网组件,内容处理组件,分析处理组件,索引组件,查询处理组件,搜索管理组件.可以将这6种组件分别部署到Sharepoint场内的多个服务器上, ...
- SharePoint 2013 搜索高级配置(Search Scope)
前言:SharePoint 2013集成了Fast Search,而后在配置上与2010及之前版本都有一些区别,如果需要开启搜索的文档,请参考我之前写的博客,博客地址附后.下面,我们开始了解下,Sha ...
- SharePoint 2013 搜索报错"Unable to retrieve topology component health. This may be because the admin component is not up and running"
环境描述 Windows 2012 R2,SharePoint 2013(没有sp1补丁),sql server 2012 错误描述 搜索服务正常,但是爬网一直在Crawling Full,但是爬不到 ...
- [转载]SharePoint 2013搜索爬外网配置
本文介绍SharePoint 2013 设置外网(Internet)爬网源: 下面是步聚: 1. 新建外部爬网源 a. 打开 “SharePoint 2013 Central Administrati ...
- SharePoint 2013 搜索爬网功能
最近在政府部门介绍SharePoint 2013 新功能,我也准备了很多,比如SharePoint 2013的Search.以后有机会谈谈Office Web App,Workflow等. Share ...
- SharePoint 2013 搜索功能,列表项目不能完全被索引
描述 最近一个站点,需要开启搜索功能,然后创建内容源,开始爬网,发现列表里只有一部分被索引,很多项目没有被索引,甚是奇怪,如下图(其实列表里有80几条项目). 首先爬网账号是系统账号.服务器管理员,所 ...
- [转载]SharePoint 2013搜索学习笔记之自定义结果源
搜索中心新建好之后在搜索结果页上会默认有所有内容,人员,对话,视频这四个结果分类,每个分类会返回指定范围的搜索结果,这里我再添加了部门日志结果分类,搜索这个分类只会返回部门日志内容类型的搜索结果,要实 ...
随机推荐
- LTIB常用命令3
http://blog.csdn.net/junht/article/details/7656540 LTIB 中的包 4.3.1 查看哪些包是使能的,并且可以安装 在配置ltib之前,您可以在一个 ...
- 20160805_CentOS6_键盘快捷键
1. 系统 -->首选项 --> 键盘快捷键 2. 3.
- SQL Server Native Client 安装方法
在 server 2008 r2 里面搜索到: sqlncli.msi 安装即可
- alertdialog.builder 自定义弹窗
<?xml version="1.0" encoding="utf-8"?> <RelativeLayout xmlns:android=&q ...
- Eclipse远程调试出现“JDWP Transport dt_socket failed to initialize”的解决方案
欢迎关注我的社交账号: 博客园地址: http://www.cnblogs.com/jiangxinnju/p/4781259.html GitHub地址: https://github.com/ji ...
- html5日期转long
正确:日期,时间均是实时的 var inDate = $("#inDate").val().trim(); if(inDate != "") { inDate ...
- ubuntu14.04LS中安装sogouPingyin
简介: 安装了新版本的ubuntu我才发现itbus的拼音是双拼的 没法改变 所以就安装了搜狗拼音 , 好像这个和小企鹅输入法有点关系 首先: 在终端中输入: sudo add-apt-reposi ...
- hduoj-----(1068)Girls and Boys(二分匹配)
Girls and Boys Time Limit: 20000/10000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) ...
- poj------(3468)A Simple Problem with Integers(区间更新)
A Simple Problem with Integers Time Limit: 5000MS Memory Limit: 131072K Total Submissions: 60745 ...
- HDUOJ--汉诺塔II
汉诺塔II Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) Total Subm ...