Elasticsearch 通常用于字符串,数字,日期等数据类型的检索,但是在 HCM.ERP 和电子商务等应用程序中经常存在对办公文档进行搜索的需求.今天的这篇文章中我们来讲一下如何实现 PDF.DOC.XLS 等办公文件的搜索,本解决方案适用于 Elasticsearch 5.0 以后的版本. 实现原理 首先把我们的 .pdf 文件进行 Base64 处理,然后上传到 Elasticsearch 中的 ingest node 中进行处理.我们可以通过 Ingest attachment pl…
这几天试用了新出不久的WinEdt 6,结合PDF文件的阅读器SumatraPDF,感觉实现TeX文档和PDF文件之间的正反向搜索十分便利,故此向大家特别推荐! CTeX v2.8版本的一项重要功能是实现了TeX文档和PDF文件之间的正反向搜索,我一般习惯称之为相互跳转.这项功能是通过对synctex文件的解析实现的,具体研究内容CTeX论坛上有详述,这里就不多说了.由于现在PDF文件是主流,无论发表文章还是写作论文,最终都要以PDF文件的形式输出,加之PDFLaTeX编译现已支持eps图形格式…
最近在做项目时需要在Web端预览一些Office文件,经过在万能的互联网上一番搜索确定并解决了. 虽然其中碰到的一些问题已经通过搜索和自己研究解决了,但是觉得有必要将整个过程记录下来,以方便自己以后查找,也方便以后碰到相同问题的朋友. 首先大家都知道在浏览器中是无法直接直接打开office文件查看的(IE除外),所以我们需要将office文件转换成其他格式来预览. 所以我的实现方法是 office文件=>pdf文件=>swf文件=>flexpaper中浏览 我们用到的软件如下: 1.li…
IOS(object-c) 下载查看 PDF 其实还是蛮容易操作的.在下载前,首先要把 IOS 可以保存文件的目录给过一遍: IOS 文件保存目录 IOS 可以自定义写入的文件目录,是很有限的,只能是这3个目录: 1. NSDocumentDirectory 下载文件到该目录,则该文档可以用 iTunes 直接查看.对于安全性不高,便于浏览的文件,pdf ,可以考虑下载到该目录.. 2. NSLibraryDirectory 下载文件到该目录,则该文档不可用 iTunes 直接查看.只能在 AP…
应项目需求要把PDF内嵌到网页中显示,其中有了很多办法,比如用<embed/>元素放入PDF文件,但是效果不理想,浏览器兼容不理想,在ie9/8(其他版本没有测试)显示会提示下载pdf文件.当然这不是我想要的效果,这种做法可以轻易地在网络上找到,我这里不就细说. 下面介绍的是另一种办法,就是借用FlashPaper软件改用swf格式来实现,各大浏览器对flash的支持已经相当友好了,除非用户禁止了现在flash. 一:FlashPaper 开始使用这款软件之前,花点时间来认识它,FlashPa…
开始不太清楚进行过什么设置,使得以前可以直接通过拖动的方式复制pdf文件到ipad里面的方法不管用了.在帖子http://bbs.weiphone.com/read-htm-tid-864091-page-3.html中看到了这样一句话“选择是否是手动或者自动同步书籍和音乐,如果是自动的就不能拖必须同步”,便觉得应该是itunes中某种设置方式造成的, 经过验证,果然是itunes设置的问题. 在Google中搜索到了Apple的帮助文档http://support.apple.com/kb/P…
Markdown写法简单明快,我十分喜欢,以至于我最近都想使用Markdown快速的进行测试说明书的写作,但是考虑到这文档是要进行交接的,一个.md的文件在内部传输还是有不便,于是就想到了能不能把Markdown转为PDF文件作为通用文件. 然后搜索后看到了这样的一篇文章如何把 Markdown 文件转化为 PDF,文中提到了很多方法,有使用.md->.html->.pdf的,也有.md->.word->.pdf,也有.md->.tex->.pdf的.最终考虑到之前曾经…
之前有个客户需要把一些html页面生成pdf文件,然后我就找一些用php把html页面围成pdf文件的类.方法是可谓是找了很多很多,什么html2pdf,pdflib,FPDF这些都试过了,但是都没有达到我要的求. pdflib,FPDF 这两个方法是需要编写程序去生成pdf的,就也是讲不支持直接把html页面转换成pdf:html2pdf这个虽然可以把html页面转换成pdf文 件,但是它只能转换一般简单的html代码,如果你的html内容要的是通过后台新闻编辑器排版的那肯定不行的. 纠结了半…
最近项目中需要到处PDF文件,最后上网搜索了一下,发现ITextSharp比较好用,所以做了一个例子: public string ExportPDF() { //ITextSharp Usage //Steps:1. Add content to cell;2. Add cell to table;3. Add table to document;4. Add document to rectangle; string sAbsolutePath = ControllerContext.Htt…
可以直接使用官方的Adobe Reader插件来实现在火狐中浏览PDF文件的功能.在你浏览一个PDF文件的时候,火狐将会尝试下载安装这个插件. 如果这个插件出现问题,那么就无计可施啦. 检查火狐的设置 点击 Firefox 窗口顶部的Firefox按钮(Windows XP 中是点击工具菜单)并选择选项 选择 应用程序 . 在搜索框里输入 Adobe Acrobat Document 来找到它. 在Acrobat Document下拉箭头的动作栏里选择使用 Adobe Acrobat (in F…