JAVA环境下利用solrj二次开发SOlR搜索的环境部署常见错误
问题一:出现控制台坏的响应错误一Bad request
控制台出现错误如下:
Bad Request
request: http://hostIP:8983/solr/update?wt=javabin&version=1
解决方法:
出现以上错误的原因是,solr服务器上配置的Field和javabean提交的Field不能对应,
导致solr服务器找不到域,拒绝访问。
打开SOLR_HOME下的conf文件夹找到schema.xml文件,在其中添加对应的域。
例如以下代码添加了:title,URL,text三个域:
还有种可能性是SolrInputDocument doc = new SolrInputDocument() 和doc.addField 不在一个循环中
问题二:为Solr服务器添加IKanalyzer中文分词组件
中文分词不支持
在进行中文搜索和建立索引的过程中,不能正确拆分中文。
解决方法:
一.把IKAnalyzer3.2.8.jar放到
apache-tomcat-6.0.32/webapps/solr/WEB-INF/lib下面
二.修改配置文件:SOLR_HOME/conf/schema.xml
问题三:Solr服务器不能搜索中文,出现中文乱码
solr中文乱码
在solr中搜索中文时出现中文乱码
解决方法:
主要是修改WEB容器的编码格式,以tomcat为例,需要修改tomcat默认的编码值为UTF-8。
具体为修改,将TOMCAT_HOME下conf文件夹下的server.xml文件内的如下代码:
<Connector port="8080" protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443" />
修改为:
<Connector port="8983" protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443" URIEncoding="UTF-8"/>
其中修改了PORT:8080为8983,,主要是SOLR服务器的默认端口为8983,添加了tomcat容器的默认编码为:URIEncoding="UTF-8"。
服务器端在获取数据的时候最好在获取数据之前加上如下一句:
//下面这句很重要确保中文不出现乱码
request.setCharacterEncoding("UTF-8");
然后再获取数据:
String title=request.getParameter("TITLE");
String URL=request.getParameter("URL");
String text=request.getParameter("TEXT");
问题四:Solr服务器的默认索引位置
Solr默认的索引存放位置为SOLR_HOME下的data/index下,
如果想存在特定的位置,就要修改索引主目录。
解决方法:
修改SOLR_HOME下conf文件夹下solrconfig.xml文件,改为:
<dataDir>${solr.data.dir:/home/solrindex}</dataDir>
则index的主要存储目录改为:/home/solrindex。
问题五:SOLR服务器的SOLR_HOME有什么作用
新建Tomcat 6.0\conf\Catalina\localhost\solr.xml:
<Context docBase="TOMCAT_HOME/webapps/solr.war" debug="0" crossContext="true" >
<Environment name="solr/home" type="java.lang.String" value="SOLR_HOME" override="true" />
</Context>
其中solrhome的作用是在浏览器中访问的地址和solr各种配置文件放置的主要目的地。
JAVA环境下利用solrj二次开发SOlR搜索的环境部署常见错误的更多相关文章
- VB6.0环境下的CATIA二次开发简介
CATIA作为CAD/CAE/CAM/PDM一体化的软件,广泛用于航空航天.汽车.船舶及电子工业,尤其在航空航天业,有八成以上厂商使用CATIA的市场[11].然而由于使用习惯和使用的侧重点不用,功能 ...
- 搭建eclipse环境下 Nutch+Mysql 二次开发环境
最近看了下Nutch,目前Nutch最新版本2.3.1,支持Hbase.MongoDB等存储,但在搭建和测试过程中发现对Mysql 的支持好像有点问题. 后来将Nutch版本改为2.2.1.基于Nut ...
- Ubuntu环境下Nutch1.2 二次开发(添加中文分词)
前提nutch1.2已部署到eclipse中 详见:http://www.cnblogs.com/cy163/archive/2013/02/19/2916419.html 1 部署IKAnalyze ...
- Windows环境下利用github快速配置git环境
在windows环境下利用github客户端我们可以直接拥有可视化的界面来管理工程,当然你也可以选择你喜欢的命令行工具来做.今天我分享一个比较快速的方式来配置git环境. 先去下载github的win ...
- Python之虚拟机操作:利用VIX二次开发,实现自己的pyvix(系列一)成果展示和python实例
在日常工作中,需要使用python脚本去自动化控制VMware虚拟机,现有的pyvix功能较少,而且不适合个人编程习惯,故萌发了开发一个berlin版本pyvix的想法,暂且叫其OpenPyVix.O ...
- Android Fragment使用(二) 嵌套Fragments (Nested Fragments) 的使用及常见错误
嵌套Fragment的使用及常见错误 嵌套Fragments (Nested Fragments), 是在Fragment内部又添加Fragment. 使用时, 主要要依靠宿主Fragment的 ge ...
- 运用Java对微信公众平台二次开发技术——开发者模式接入
当初我在这碰到了很多问题,市面上以及网络上的资料特别少,所以当初碰了很多壁,所以现在跟大家分享一下,如何用Java,对微信公众平台进行二次开发. 一.开发预备知识: 最基本的JavaSE与JavaWe ...
- java eclipse war包的二次开发方法
有实际项目在跑的war包,却没有源码,苦于想查看源码,身处运维组为研发组看不起,拿不到源码,只能自己来反编译了. 只要你细心点,其实在解压war包后,可以看到文件夹中,已经存在了jsp文件,但是却没有 ...
- 新闻实时分析系统 基于IDEA环境下的Spark2.X程序开发
1.Windows开发环境配置与安装 下载IDEA并安装,可以百度一下免费文档. 2.IDEA Maven工程创建与配置 1)配置maven 2)新建Project项目 3)选择maven骨架 4)创 ...
随机推荐
- 获取文件夹总大小方法2_获取cmd命令结果,效率最高
public static long GetDirectorySize(string path) { long res = 0; System.Diagnostics.Process p = new ...
- 项目管理工具maven(一)
1 Maven的概述 1.1 依赖管理 就是对jar包的统一管理 可以节省空间 1.2 项目一键构建 编码 编译 测试(junit) 运行 打包 部署 一个 tomcat:run就能把项目 ...
- Input设置只读属性
input设置为只读一般用于查看详情: 格式为: (1)单纯的input框 <div class="form-group"> <label for="c ...
- How to create a site with AJAX enabled in MVC framework.
How to create a site with AJAX enabled in MVC framework. The Project illustrates how to create a web ...
- POI 3.17
发现与之前使用的有些不同 参考:https://www.cnblogs.com/h--d/p/6735110.html
- $(window).scrollTop() 获取当前的鼠标位置 offset.left()指定标签在html中的坐标 offset.top() 指定标签在html中的坐标position() 指定标签相对父(relative)标签的坐标
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
- Visual Studio 使用Web Deploy发布项目
工具:Web Deploy 3.6 点击下载 (强烈推荐使用独立的Web Deploy 安装包安装) 使用 Web Platform Installer 安装 Web Deploy(3.5,3.6都安 ...
- ACM Dance Recital(dfs+剪枝)
The Production Manager of a dance company has been tasked with determining the cost for the seasonal ...
- Python运维开发基础06-语法基础
上节作业回顾 (讲解+温习120分钟) #!/usr/bin/env python3 # -*- coding:utf-8 -*- # author:Mr.chen # 添加商家入口和用户入口并实现物 ...
- python之time&datetime
[time] secs:统一值,无local.UTC之分. struct_time:有local.UTC之分. time.time():返回secs,secs为统一值,无local&utc之分 ...