在用SimplePostTool工具导入CSV文件,文件内容如下: 启动solr ,利用命令导入:java -Dtype=text/csv -Dc=solr_test -jar post.jar ..\ImportData\*.csv 打开浏览器输入:http://localhost:8983/solr 查询: 可以看到,包含中文的字段都是乱码,原因是出在csv文件的编码不是 utf-8格式,把csv文件的编码改utf-8就可以了. 删除数据, 重新导入数据,再重新查询如下: 数据正常了…
本文主要是介绍通过SimplePostTool工具索引文件的结果进行确认,针对不同的文件,索引的结果不同. 1.创建core 首先启动solr,建立名称为data的core,SimplePostTool工具使用参照:http://www.cnblogs.com/shaosks/p/7390523.html 由于导入文件的过程需要用到post.jar这个包,所以先把solr-6.6.0\example\exampledocs文件夹下的post.jar拷贝到solr-6.6.0\bin文件夹下. s…
一.背景介绍 Solr启动并运行之后,并不包含任何数据,在solr的安装目录下的bin目录中,有一个post工具,我们可以使用这个工具往solr上传数据,这个工具必须在命令行中执行,post工具是一个Unix脚本工具, 没有windows版本(但可以在java程序中调用),我们可以使用SimplePostTool来代替 参考:https://cwiki.apache.org/confluence/display/solr/Post+Tool#PostTool-Windows 二.系统配置: Si…
通过测试发现用SimplePostTool与solr界面dataimport索引数据的结果有如下区别: 1.SimplePostTool索引数据对结构化数据文件索引比较合适,比如csv/json/xml(必须符合一定的格式的xml格式才行)等.但是如果文档中中文数据,那么文档必须以utf-8来进行保存,否则索引数据后会有乱码.   对非结构化数据文件索引无法搜索. 2.solr界面dataimport索引数据不关心文档的保存格式,但是索引的结果都是把文档的数据都索引到一个字段中比如text,这样…
创建文件快捷菜单设置 打开窗口“Customize Perspective - Java EE”,切换选项卡到“Shortcuts”: 进行一下配置: “Generate”:如上图勾选方式 "Java":勾选所有java,之后进入子节点JUnit,去掉“JUnit Test Suite”. "SQL Development":全勾选 "Web":全勾选,之后去掉”Static Web Project“."Web Fragment Pro…
解決BufferedReader读取UTF-8文件中文乱码         File rst01 = new File(context.getRealPath("/")+"zljb0.html");         File rst02 = new File(context.getRealPath("/")+"zljb.html"); InputStreamReader isr = new InputStreamReader(…
解决java web中safari浏览器下载后文件中文乱码问题 String fileName = "测试文件.doc"; String userAgent = request.getHeader("User-Agent").toLowerCase(); //Java下载文件时IE浏览器出现文件名乱码 // 针对IE或者以IE为内核的浏览器: if (userAgent.contains("msie") || userAgent.contains…
Windows下Git Bash中VIM打开文件中文乱码,解决方法是: 步骤一 admin@DESKTOP-O99620V MINGW64 /d/项目GGE/Hard_for_GGE (master) $ cd /etc/ admin@DESKTOP-O99620V MINGW64 /etc $ vi vimrc 步骤二 在打开的vimrc文件开头添加以下代码: set nu set fencs=utf-,gbk,utf-,utf-,ucs-bom 保存并退出vimrc编辑文档. 步骤三 1.退…
转自:http://jingyan.baidu.com/article/ed2a5d1f3381d709f6be17f8.html 打开Myeclipse,找到window这一栏,点击Preference 2 然后会弹出一个窗体,点击General展开选项,然后点击Content Types   3 在右边的窗口中点击Text展开,然后点击java Properties File   4 将下面的编码格式设置成UTF-8就能解决java Web项目文件中的config.properties文件中…
正文: TXT文件默认编码为ANSI,另存为编码为UTF-8的文本文件即可 备注: 1,一般需要导入的数据都是一张excel表,需要将excel表另存为“文本文件(制表符分隔)(*.txt)”保存类型 2,excel工作簿包含多份工作表时,只会转存第一张表,自己视情况处理吧 3,此时转为的txt文本默认编码为ANSI,需要打开text文件,再另存为UTF-8格式 4,navicat中右键→打开表→表的上方有“导入”标识→选择导入文本文件(*.txt)→按引导操作即可 参考博客: 1,navica…