全文检索技术   Lucene&Solr               Part3 1. 课程计划 1. Solr配置中文分析器 a) Schema.xml的配置 b) 配置IKAnalyzer 2. DataimportHandler插件 3. Solrj的复杂查询 a) 后台复杂查询 b) solrJ实现复杂查询 4. 京东案例 2. 配置中文分析器 2.1. Schema.xml schema.xml,在SolrCore的conf目录下,它是Solr数据表配置文件,它定义了加入索引的数据的数…
一.案例 电商网站的搜索 在互联网项目中做搜索都应该使用全文检索. 查询的是索引库,搜索功能跟数据库没有关系.实现分析: 1.先创建索引库 需要把数据库中的数据导入到索引库中. 需要把数据库中每个字段的内容放到索引库中对应的域中. 在索引库中需要先定义业务域. 需要在schema.xml中定义业务域. 需要配置中文分析器. 2.实现查询功能 二.定义业务域1.schema.xml 1)field域的定义 name:域的名称 type:域的数据类型.是否分析取决于数据类型 类型都是在schema.…
目录 1 添加文档的细节 1.1 注册观察者 - watcher 1.2 文档的路由 - document route 1.2.1 路由算法 1.2.2 Solr路由的实现类 1.2.3 implicit路由算法的使用 1.2.4 Solr获取文档Hash值的要求 2 添加索引的过程 3 更新索引的过程 4 Solr创建和更新索引的总结 4.1 Leader的转发规则 4.2 高效实践的建议 1 添加文档的细节 1.1 注册观察者 - watcher Solr单机服务中, 与Solr内部进行交互…
首先,讲解一下/usr/local/solr/collection1/conf/schema.xml的配置,此文档功能类似于配置索引数据库. Field:类似于数据库字段的属性(此文统一使用用“字段”描述它),请看一条field <field name="user" type="string" indexed="true" stored="true" multiValued="true" />…
在一个应用的整个开发过程中涉及到了无数的步骤.其中一些是应用的说明,图片的创作,应用的实现,和实现过后的测试阶段.写代码可能组成了这个过程的绝大部分,因为正是它给了应用生命,但是这样还不够,与它同等重要的还有代码的注释和文档编写.不管代码写的有多好,如果缺少了对应的好的注释文档,很有可能在将来带来麻烦.不幸的是,许多开发者都忽视或忽略了代码文档的重要性,而这非常糟糕,因为好的程序不仅仅是好的代码.它需要更多的东西. 谈到编写注释文档,显然我不是说仅仅简单的在实现文档里添加几行注释.肯定是更多的东…
本文简要分析一下如何如何使用C#简单实现合并和拆分word文档.平时我们在处理多个word文档时,可能会想要将两个文档合并为一个,或者是将某个文档的一部分添加到另一个文档中,有的时候也会想要将文档拆分.在Word中,合并或拆分文档最简单的方式就是打开一个原文档的副本文件,复制我们需要的部分,删除不需要的部分,然后再保存文档.使用这种方法在文档比较多或者比较大时手动操作起来比较费时,以下是使用C#实现合并一个Word文档的某一个section到另一个文档或者合并两个完整的Word文档到一个单独的文…
本文版权归博客园和作者吴双本人共同所有,转载和爬虫请注明博客园蜗牛原文地址,cnblogs.com/tdws   写在前面 请原谅我这个标题党,写到了第100篇随笔,说是深度优化,其实也并没有什么深度.源码也没怎么修改,如果你想使用WebApi Swagger文档,请先移步到上一篇的中度优化. 第一篇:ASP.NET WebApi 文档Swagger中度优化 http://www.cnblogs.com/tdws/p/6100126.html 第二篇:ASP.NET WebApi 文档Swash…
本文版权归博客园和作者吴双本人共同所有,转载和爬虫请注明原文地址:www.cnblogs.com/tdws   写在前面 在后台接口开发中,接口文档是必不可少的.在复杂的业务当中和多人对接的情况下,简单的接口文档又不能满足需求,试想你的单应用后台有几十个模块,几百甚至更多的接口,又有上百个ViewModel.怎么能让人用起来更顺手更明了?本篇介绍第一步的中度优化,下一篇将分享下一阶段的深度优化. 第一篇:ASP.NET WebApi 文档Swagger中度优化 1.上手使用 2.Controll…
之前和我们项目的团队一起酝酿了一个项目,公司的业务文档技术文档比较多,但都比较分散,虽然通过FTP或其他方式聚合起来了,但感觉还是不够方便. 另外公司每次都来新员工,新员工都需要一些培训,比较耗时,比较好的方法是把以前的配置录制视频然后线下先给新员工自己看,但时间久了,资料或视频总是找不到或不是最新等等. 于是我们团队想了一个项目,把已有的资料和视频从线下放到线上,就是能通过一个网站在线看office资料和视频.并且还能对资料评价和点赞等,根据点赞或想学等数据再决定是否对新员工或老员工来一次组织…
转载自:http://blog.163.com/hui_san/blog/static/5710286720104191100389/ 前言 Java 的语法与 C++ 及为相似,那么,你知道 Java 的注释有几种吗? 1)// 注释一行   2)/* ...... */ 注释若干行 3)/** ...... */ 注释若干行,并写入 javadoc 文档 通常这种注释的多行写法如下: /**   * .........   * .........   */ 这第三种注释有什么用?javado…
今天遇到一个问题,就是需要把多个Word文档的内容追加到一个目标Word文档的后面,如果我有目标文档a.doc以及其他很多个文档b.doc,c.doc…等等数量很多.这个问题,如果是在服务端的话,直接使用OpenXML技术,读写文档就可以实现,这样性能较稳定,但是需要对OpenXML有一定的了解.如果在客户端机器上,可以使用Word PIA实现. 由于本人对于Word PIA较熟悉,所以采用了该方法.但是在实现的过程中,也是有很多种思路的. 将b.doc打开,将其中的内容选中,复制到剪贴板,然后…
UnrealEngine 4和Unity3d的选择 订阅了UrealEngine4(UE4)开发者.我开始做网站用的是ASP.NET和C#,之后做网站虽然换用更方便的PHP(因为做的都是小网站).我想说,做了长达7年的小网站就算我再水,但是C#我还是懂一些的,而Unity3d刚刚好最建议用的就是C#.C++我不懂,只在高中毕业后看了C++编程思想并把大部分例子都手打入电脑并运行.不极是在肖极Unity3d在移动端有大量成功的案例,文档非常好,视频教程也很全,研究的人也非常多,有问题很容易找到文案…
插入文档: db.foo.insert({ "key" : "value"}); 使用insert插入一个数据,文档中如果没有_id 会自动给文档增加_id. batchInsert(Array)  批量插入,接受一个文档数组做参数. 使用批量插入最大长度48M,如果过程中一个失败,失败之前会插入成功,之后全都失败. 可以设置continueOnError 选项设置忽略错误并且继续插入. 插入校验: 所有文档必须都小于16M. 删除文档: db.foo.remove…
C#打开word文档常用有两种方法:Add与Open. Microsoft.Office.Interop.Word._Document doc = (Document)appWord.Documents.Add(ref wordpath, ref objfalse, ref objDocType, ref objtrue); //Add方法 Microsoft.Office.Interop.Word._Document doc = (Document)appWord.Documents.Open…
Word文档合并的一种实现   今天遇到一个问题,就是需要把多个Word文档的内容追加到一个目标Word文档的后面,如果我有目标文档a.doc以及其他很多个文档b.doc,c.doc…等等数量很多.这个问题,如果是在服务端的话,直接使用OpenXML技术,读写文档就可以实现,这样性能较稳定,但是需要对OpenXML有一定的了解.如果在客户端机器上,可以使用Word PIA实现. 由于本人对于Word PIA较熟悉,所以采用了该方法.但是在实现的过程中,也是有很多种思路的. 将b.doc打开,将其…
该文档是Testerhome官方翻译的源地址:https://github.com/appium/appium/tree/master/docs/cn官方网站上的:http://appium.io/slate/cn/master/?ruby#about-appium 中文Appium API 文档 第一章:关于appium 1.1 appium客户端 客户端类库列表及Appium服务端支持 这些类库封装了标准Selenium客户端类库,为用户提供所有常见的JSON 格式selenium命令以及额…
http://www.itpub.net/thread-1921612-1-1.html !!!https://code.google.com/p/plsql-utils/ Introduction介绍 Excel文档的数据如何读取到Oracle数据库一直是值得深究的问题. 目前相信大部分程序员都是直接用工具将Excel的数据读取到Oracle数据库的.例如Toad,PL/SQL Developer的Excel数据导入功能. 也有一部分程序开发的是:先将Excel转换为一个逗号分隔符等的文本文件…
NET WebApi 文档Swagger中度优化   本文版权归博客园和作者吴双本人共同所有,转载和爬虫请注明原文地址:www.cnblogs.com/tdws   写在前面 在后台接口开发中,接口文档是必不可少的.在复杂的业务当中和多人对接的情况下,简单的接口文档又不能满足需求,试想你的单应用后台有几十个模块,几百甚至更多的接口,又有上百个ViewModel.怎么能让人用起来更顺手更明了?本篇介绍第一步的中度优化,下一篇将分享下一阶段的深度优化. 第一篇:ASP.NET WebApi 文档Sw…
问题 现在给出很多份文档,现在对某个搜索词感兴趣,想找到相关的文档. 简单搜索 一种简单粗暴的做法是: 1.读取每个文档:2.找到其中含有搜索词的文档:3.对找到的文档中搜索词出现的次数统计:4.根据搜索词统计次数对文档按降序排序. 这称之为信息获取(Information Retrieval, IR),也叫简单搜索 普通IR方案存在的问题:    文档的体积增大或者数量增多,算法效率会下降    改进搜索的方案 Lucene项目对文档进行索引来快速搜索. 问题又来了:仅有索引仍不够,还有: 链…
该文档是Testerhome官方翻译的源地址:https://github.com/appium/appium/tree/master/docs/cn官方网站上的:http://appium.io/slate/cn/master/?ruby#about-appium 中文Appium API 文档 第一章:关于appium1.1 appium客户端客户端类库列表及Appium服务端支持 这些类库封装了标准Selenium客户端类库,为用户提供所有常见的JSON 格式selenium命令以及额外的…
原文地址:http://www.work100.net/training/java-documentation.html 更多教程:光束云 - 免费课程 文档注释 序号 文内章节 视频 1 概述 2 javadoc标签 3 文档注释 4 javadoc输出什么 请参照如上章节导航进行阅读 1.概述 Java 支持三种注释方式.前两种分别是 // 和 /* */,第三种被称作说明注释,它以 /** 开始,以 */ 结束. 说明注释允许你在程序中嵌入关于程序的信息.你可以使用 javadoc 工具软…
介绍 vuepress-template是一个简单的VuePress案例模板,目的是让用户可以直接clone这个仓库,作为初始化一个VuePress网站启动项目,然后在这个项目的基础上新增自定义配置和功能. 为什么推荐这个模板? 有部分刚接触VuePress的同学,按照官方教程操作下来会遇到大大小小的问题,特别是文件目录.打包.插件安装这几块内容.如果直接复制官方的仓库又会比较大,所以如果有一个这样的简洁的初始模板,直接启动使用就很方便了. 而且对应的插件能直接看到效果,使用起来更能得心应手.…
目录 创建HTML文档 构筑基本的文档结构 DOCTYPE元素 DOCTYPE元素 代码清单1 使用DOCTYPE元素 html元素 html元素 代码清单2 使用html元素 head元素 head元素 代码清单3 使用head元素 body元素 body元素 代码清单4 使用body元素 用元数据元素说明文档 设置文档标题 title元素 代码清单5 使用title元素 设置相对URL的解析基准 base元素 使用href属性 代码清单6 使用base元素中的href属性 提示 使用targ…
Solr开发文档 Solr 是一种可供企业使用的.基于 Lucene 的搜索服务器,它支持层面搜索.命中醒目显示和多种输出格式.在这篇文章中,将介绍 Solr 并展示如何轻松地将其表现优异的全文本搜索功能加入到 Web 应用程序中. 开发环境: System:Windows WebBrowser:IE6+.Firefox3+ JDK:1.6+ JavaEE Server:tomcat5.0.2.8.tomcat6 IDE:eclipse.MyEclipse 8 开发依赖库: JavaEE 5.s…
[课程分享]IT件项目管理(企业项目甘特图案例评价.维护管理.文档管理.风险管理.人力资源管理) 对这个课程有兴趣的朋友能够加我的QQ2059055336和我联系 课程讲师:丁冬博士 课程分类:Java 适合人群:中级 课时数量:32课时 用到技术:IT软件项目配置.IT软件项目模板的制定 涉及项目:IT软件企业项目甘特图案.IT软件项目可行性报告分析.基于svn的IT软件项目配置管理案例 更新程度:完毕 课程背景: 该课程是北风品牌项目管理课程系列之中的一个<IT项目管理>课程.通过本课程的…
一,网上的API讲解 其实POI的生成Word文档的规则就是先把获取到的数据转成xml格式的数据,然后通过xpath解析表单式的应用取值,判断等等,然后在把取到的值放到word文档中,最后在输出来. 1.1,参考一 1.poi之word文档结构介绍之正文段落 一个文档包含多个段落,一个段落包含多个Runs,一个Runs包含多个Run,Run是文档的最小单元 获取所有段落:List<XWPFParagraph> paragraphs = word.getParagraphs(); 获取一个段落中…
关于石墨文档(Android)客户端的案例分析 作业地址:[https://edu.cnblogs.com/campus/nenu/2016CS/homework/2505] 第一部分调研,评测 1.下载并使用,按照描述的bug定义,找3~5个功能性的比较严重的bug.请用专业的语言描述(每个bug 不少于 40字),如有必要,请配图. 答: Bug1:文字识别功能不准确,当我使用拍照和照片进行文字识别的时候,发现有一部分内容没有识别到,一部分出现错别字,还有一部分内容识别顺序有误,我认为这一部…
一.Solrj的使用 1.什么是Solrj solrj是访问Solr服务的java客户端(就像通过jedis操作redis一样),提供索引和搜索的请求方法,SolrJ通常在嵌入在业务系统中,通过SolrJ的API接口操作Solr服务,如下图: 2.如何使用 需要的是solrj的包与拓展服务包 使用solrj完成索引的维护: 在solr中,索引库中都会存在一个唯一键,如果一个Document的id存在,则执行修改操作,如果不存在,则执行添加操作. 添加/修改索引: 1. 创建HttpSolrSer…
本文知识点:     1潜在畸形页面使用htmlTreeParse函数 2startElement的用法 3闭包 4handler函数的命令和函数体主要写法 5节点的丢弃,取出,取出标签名称.属性.属性值.内容 6修改树中节点的属性.节点计数.存储节点 7匿名函数写法 8xmlHashTree函数和xmlRoot函数和trun参数(此条存疑) 9编码 10try和trycatch,中断 11xinclude   原书中虽然主要是关于HTML的,但是我想把重心放在2.4解析一节的内容,进行扩充和增…
文档是数组转成的json 原数组: array( 0 =>3, 1 =>3, 2 =>4, 3 =>5, 4 =>5, 5 =>6) 用array_unique去掉数组中重复的元素后,插入时报错. 原因: array_unique去重之后,原数组的下标被保留了.数组为 array( 0 =>3, 2 =>4, 3 =>5, 5 =>6 ) 在json_encode数组时,会把下标不连续的数组解析成json字符串例如{"0":&…