在ssh中利用Solr服务建立的界面化站内搜索---solr2

继上次匆匆搭建起结合solr和nutch的所谓站内搜索引擎之后，虽当时心中兴奋不已，可是看了看百度，再只能看看我的控制台的打印出每个索引项的几行文字，哦，好像差距还是有点大……

简陋的信息显示环境最起码给了我一个信号，这条路没有走错，好吧，让我们来继续探索搜索引擎的奥秘吧。

上期回顾：上次主要是介绍了solrj，通过solrj的api与solr服务器进行通信，获取服务器上的索引数据以及在编写程序中遇到的一些问题和解决方法。本期主要是建立与solr服务器的通信，提供搜索界面输入关键字或搜索规则，根据关键字或规则到索引数据中寻找匹配项并返回结果到界面上。

1.本篇的前提是你已经配置好nutch以及solr，并通过网页爬取将索引数据存放到了solr服务器中（solr可以可以部署到tomcat的下也可以不部署，另外我的所有搭建都是在Ubuntu环境下），我配置了中文分词器，以上工作可以在网上搜，资料很多，过程中也有很多错误需要解决，如果有时间我会对这块做个总结，solr服务器的界面如下：

接下来就是要做一个搜索界面，基于是一个纯所搜引擎，所以提供一个招牌、一个输入框以及一个确认按钮即可，关于招牌定什么，问过朋友，有吸引眼球的千度、谷哥哥，一看就是要和度娘们叫板，算了咱不干以卵击石的事，还是有点自知之明的好，最终还是叫“jiesearch”吧——小众，不矫情。这块不涉及什么代码量，所以就多扯了几句，界面如下：

2.针对上次主题代码进行完善，因为上次返回的是一个SolrDocumentList 对象，不能直接转换为到jsp页面显示的list集合，所以借鉴网上前辈们的指点对代码进行了改写。

//首先定义HttpSolrServer对象，用于程序连接solr

 public class SolrServer {

 private static SolrServer solrServer = null;

 private static HttpSolrServer server=null;

 private static String url="http://solrIP:8080/solr";

 public static synchronized SolrServer getInstance() {

      if (solrServer==null){

          solrServer=new SolrServer();

        }

         return solrServer;

 }

 public static HttpSolrServer getServer(){

     try {

         if(server==null){

             server = new HttpSolrServer(url);

             server.setSoTimeout(1000); // socket read timeout

             server.setConnectionTimeout(1000);

             server.setDefaultMaxConnectionsPerHost(100);

             server.setMaxTotalConnections(100);

             server.setFollowRedirects(false); // defaults to false

             //allowCompression defaults to false.

             //Server side must support gzip or deflate for this to have any effect.

             server.setAllowCompression(true);

             server.setMaxRetries(1); // defaults to 0. > 1 not recommended.

             }

       } catch (Exception e) {

             // TODO Auto-generated catch block

             e.printStackTrace();

         }

     return server;

     }

 }

//然后定义一个实体类BlogsDo用于接收和配置索引的各个字段

 @Entity

 @Table(name="blogs")

 public class BlogsDO implements Serializable{

     private static final long serialVersionUID = -4721368786493126226L;

     @Field("Id")

     private String id;

     @Field("content")

     private String content;

     @Field("title")

     private String title;

     @Field("url")

     private String url;

     @Field("_version_")

     private String _version_;

     public String getId() {

         return id;

     }

     public void setId(String id) {

         this.id = id;

     }

     public String getContent() {

         return content;

     }

     public void setContent(String content) {

         this.content = content;

      }

     public String getTitle() {

         return title;

     }

     public void setTitle(String title) {

         this.title = title;

     }

     public String getUrl() {

         return url;

     }

     public void setUrl(String url) {

         this.url = url;

     }

     public String get_version_() {

         return _version_;

     }

     public void set_version_(String version) {

         _version_ = version;

     }

     public static long getSerialversionuid() {

         return serialVersionUID;

     }

 }

备注：这些字段相应的都应该在schema.xml中存在<fields></fields>之间，如下所示，另外个人理解，对于实体类上的注解 @Field("")应该也是一种映射，就是将实体类的字段与配置文件中的选项相对应。

//添加查询规则以及是否高亮的设置以及结果的返回与接收

 String searchWord=request.getParameter("searchText");

 List<BlogsDO> blogList=new ArrayList<BlogsDO>();

 BlogsDO blogsDO=null;

 HttpSolrServer solrServer= SolrServer.getInstance().getServer();

 SolrQuery sQuery = new SolrQuery();

 String para="";

 Page page=null;

 para="content:"+searchWord+"";

 logger.info("para:"+para);

 sQuery.setQuery(para);

 sQuery.setStart(0);

 sQuery.setRows(10);

 //设置高亮

 sQuery.setHighlight(true); // 开启高亮组件

 sQuery.addHighlightField("content");// 高亮字段

 sQuery.addHighlightField("title");// 高亮字段

 sQuery.setHighlightSimplePre("<font color='red'>");//标记，高亮关键字前缀

 sQuery.setHighlightSimplePost("</font>");//后缀

 sQuery.setHighlightSnippets(2);//结果分片数，默认为1

 sQuery.setHighlightFragsize(1000);//每个分片的最大长度，默认为100

 //分片信息

 sQuery.setFacet(true)

 .setFacetMinCount(1)

 .setFacetLimit(5)//段

 .addFacetField("content");//分片字段

 long startSearch=System.currentTimeMillis();

 Integer counts=0;

 try {

     QueryResponse response = solrServer.query(sQuery);

     SolrDocumentList list = response.getResults();

     counts=(int) list.getNumFound();//搜索数量

     logger.info("counts:"+counts);

     //获取所有高亮的字段

     Map<String,Map<String,List<String>>> highlightMap=response.getHighlighting();

     String blogId="";

     for (SolrDocument solrDocument : list) {

     blogsDO=new BlogsDO();

     blogId=(String) solrDocument.getFieldValue("id").toString();

     blogsDO.setId(blogId);

     blogsDO.set_version_(solrDocument.getFieldValue("_version_").toString());

     blogsDO.setUrl(solrDocument.getFieldValue("url").toString());

     List<String> titleList=highlightMap.get(blogId).get("title");

     List<String> contentList=highlightMap.get(blogId).get("content");

     if(titleList!=null && titleList.size()>0){

         blogsDO.setTitle(titleList.get(0));

     }else{

     //获取并设置高亮的字段title

     blogsDO.setTitle(solrDocument.getFieldValue("title").toString());

     }

     if(contentList!=null && contentList.size()>0){

         blogsDO.setContent(contentList.get(0));

      }else{

     //获取并设置高亮的字段content

         blogsDO.setContent(solrDocument.getFieldValue("content").toString());

     }

     blogList.add(blogsDO);

     }

 } catch (SolrServerException e) {

     e.printStackTrace();

 }

 long endSearch=System.currentTimeMillis();

 model.addObject("time", (double)(endSearch-startSearch)/1000);

 model.addObject("counts", counts);

 model.addObject("blogList", blogList);

3.下面要做的就是在前台jsp页面中接收list集合和传过去的counts（搜索结果个数），time(搜索耗时)并相应的调整界面布局即可，效果如下：

至此一个搜索引擎做的算是有点模样了，下一步如果还有时间可以对本地文档图片等建立索引并实现搜索功能。

另外最近我在看大数据可视化方面的东西，如果有兴趣有见解的可以交流下

邮箱：zjhxp_1990@163.com

文中如有不足和错误还请指正！

参考博文：http://blog.csdn.net/chunming8302/article/details/7321501

友情赞助

如果你觉得博主的文章对你那么一点小帮助，恰巧你又有想打赏博主的小冲动，那么事不宜迟，赶紧扫一扫，小额地赞助下，攒个奶粉钱，也是让博主有动力继续努力，写出更好的文章^^。

　　　　1. 支付宝　　　　　　　　　　　　　　　　　　　　　　　　　　2. 微信

在ssh中利用Solr服务建立的界面化站内搜索---solr2的更多相关文章

在ssh中利用Solr服务建立的界面化站内搜索
继上次匆匆搭建起结合solr和nutch的所谓站内搜索引擎之后,虽当时心中兴奋不已,可是看了看百度,再只能看看我的控制台的打印出每个索引项的几行文字,哦,好像差距还是有点大…… 简 ...
利用Solr服务建立的站内搜索雏形---solr1
最近看完nutch后总感觉像好好捯饬下solr,上次看到老大给我展现了下站内搜索我便久久不能忘怀.总觉着之前搭建的nutch配上solr还是有点呆板,在nutch爬取的时候就建立索引到solr服务下, ...
利用Solr服务建立的站内搜索雏形
最近看完nutch后总感觉像好好捯饬下solr,上次看到老大给我展现了下站内搜索我便久久不能忘怀.总觉着之前搭建的nutch配上solr还是有点呆板,在nutch爬取的时候就建立索引到solr服务下, ...
JAVAEE——宜立方商城07：Linux上搭建Solr服务、数据库导入索引库、搜索功能的实现
1. 学习计划 1.Solr服务搭建 2.Solrj使用测试 3.把数据库中的数据导入索引库 4.搜索功能的实现 2. Solr服务搭建 2.1. Solr的环境 Solr是java开发. 需要安装j ...
Django之站内搜索-Solr,Haystack
java -version 不多说 solr 是java 开发的 java version "1.7.0_79" Java(TM) SE Runtime Environment ( ...
solr服务中集成IKAnalyzer中文分词器、集成dataimportHandler插件
昨天已经在Tomcat容器中成功的部署了solr全文检索引擎系统的服务:今天来分享一下solr服务在海量数据的网站中是如何实现数据的检索. 在solr服务中集成IKAnalyzer中文分词器的步骤: ...
J2EE进阶(七)利用SSH框架根据数据表建立model类
J2EE进阶(七)利用SSH框架根据数据表建立model类前言在利用SSH框架进行项目开发时,若将数据库已经建好,并且数据表之间的依赖关系已经确定,可以利用Hibernate的反转功能进行mode ...
【C#】教你纯手工用C#实现SSH协议作为GIT服务端
SSH(Secure Shell)是一种工作在应用层和传输层上的安全协议,能在非安全通道上建立安全通道.提供身份认证.密钥更新.数据校验.通道复用等功能,同时具有良好的可扩展性.本文从SSH的架构开始 ...
利用solr实现商品的搜索功能
后期补充: 为什么要用solr服务,为什么要用luncence? 问题提出:当我们访问购物网站的时候,我们可以根据我们随意所想的内容输入关键字就可以查询出相关的内容,这是怎么做到呢?这些随意的数据 ...

随机推荐

条件随机场理论分析CRF(Conditional Random Field)
高亮 TRichEdit 当前行
var gStart, gLength, gCol: Integer; procedure SetRichEdit(aRichEdit: TRichEdit); var fRow, fCol: ...
分享一个批量导出当前实例下的所有linkedserver脚本
分享一个批量导出当前实例下的所有linkedserver脚本很多时候,我们都需要导出实例下面的登录用户,job,linkedserver等等导出job比较复杂,下午写了一个脚本把所有的linked ...
Service简介
Service是在一段不定的时间运行在后台,不和用户交互应用组件.每个Service必须在manifest中通过<service>来声明.可以通过contect.startservice ...
Intellij笔记
环境官网: http://www.jetbrains.com/idea/download/ 需要Java的JDK,需要安装 JDK,而不是 JRE! http://www.oracle.com/te ...
Wix 安装部署教程(十四) -- 多语言安装包之用户许可协议
在上一篇中,留下了许可协议的问题,目前已经解决.感谢网友武全的指点! 问题一般我们是用WixVariable 来设定许可协议.如下所示: <WixVariable Id="WixUI ...
【吉光片羽】MVC 导出Word的两种方式
1.直接将Html转成Word.MVC自带FileResult很好用.Html中我们也可以嵌入自己的样式. html: <div id="target"> <st ...
(翻译)反射处理java泛型
当我们声明了一个泛型的接口或类,或需要一个子类继承至这个泛型类,而我们又希望利用反射获取这些泛型参数信息.这就是本文将要介绍的ReflectionUtil就是为了解决这类问题的辅助工具类,为java. ...
探求网页同步提交、ajax和comet不为人知的秘密（中篇）
深入研究某项技术,了解使用这些技术的细节,其实最终目的都是为了完成一个选择问题:当我们要使用这些技术解决某个具体的问题时候我们到底该如何去选择.如果碰到有两种技术可以让我们达到同样的目的,我们就会不自 ...
C#Light 再推荐，顺便介绍WP8 功能展示项目
由于在项目中验证了C#Light脚本,C#Light的健壮和稳定程度已经得到了很大的提升. 现在可以更好的把C#Light介绍给大家使用,同时也有更多的自信,告诉大家这是一个已经具有商业价值的类库. ...

在ssh中利用Solr服务建立的界面化站内搜索---solr2

在ssh中利用Solr服务建立的界面化站内搜索---solr2的更多相关文章

随机推荐

热门专题