刚才有写一个小练习<Html代码保存为Pdf文件>http://www.cnblogs.com/insus/p/4323224.html.马上有网友说,当截取块有中文时,保存的pdf文件将显示乱码.记得前一篇<上传Text文档并转换为PDF>http://www.cnblogs.com/insus/p/4313092.html 的 #2楼网友也反馈相同的问题. Insus.NET决定测试并解决此问题,先看看测试html,果然是乱码或是不显示. 打开控制器,创建标记A和B两个操作:…
原文 操作PDF文档功能的相关开源项目探索——iTextSharp 和PDFBox 很久没自己写写心得日志与大家分享了,一方面是自己有点忙,一方面是自己有点懒,没有及时总结.因为实践是经验的来源,总结是提升的基础,所以无论怎样,自己都该反省一下.今天我主要是研究学习了两个PDF文档的相关类,iTextSharp 和PDFBox.我研究出发点是实现PDF文档的检索,需要提取PDF文档中的文字内容,然后通过正则匹配实现搜索. <类似Windows Search的文件搜索系统>中介绍的文件检索方法是…
本文分享在Linux系统下,通过Java 程序代码将Word转为PDF文档时,结果文档内容出现乱码该如何解决.具体可参考如下内容: 1.问题出现的背景 在Windows系统中,使用Spire.Doc for Java将Word文档转换为PDF格式时(如下代码),结果文档内容正常:但是在Linux系统中,转出来PDF文档出现乱码或方框. import com.spire.doc.*; public class WordtoPDF { public static void main(String[]…
电子书的优点很多,随时随地阅读,无论白天黑夜走路坐车都能阅读:想确认一下某句话是不是这本书里的,搜索一下就可以知道:搬家也不用发愁,几万本书带在身上,依然轻松步行.我买了一台平板主要动因就是为了看书,但是有时候会遇到一些问题:一本PDF格式的电子书在电脑上打开时显示正常,用手机打开却出现乱码.通过网络查询,找到了解决办法.这里分享给大家.过程不算很麻烦.一本书2-3分钟搞定. PDF文件自身是可以嵌入字体的,这样就可以在任何语言的设备上直接阅读,而不用考虑该设备上是否有相应的字体.但是PDF文件…
第一步,安装openoffice.org openoffice.org是一套sun的开源office办公套件,能在widows,linux,solaris等操作系统上执行. 主要模块有writer(文本文档),impress(演示文稿),Calc(电子表格),Draw(绘图),Math(公式),base(数据库) 笔者下载的是openoffice.org 3.3.0.下载完直接安装即可. 但是,我们还需要启动openoffice server.有两种做法: 1.以命令行方式启动openoffic…
TCPDF是一个用于快速生成PDF文件的PHP5函数包.TCPDF基于FPDF进行扩展和改进.支持UTF-8,Unicode,HTML和XHTML.在基于PHP开发的Web应用中,使用它来输出PDF文件是绝佳的选择.但毕竟这款开源软件是外国人开发的,对中文的支持总不是那么尽如人意,因此我们需要对它作进一步的增强.首先要下载TCPDF.访问http://www.tcpdf.org ,单击导航条上的”Download”链接,即可下载到最新版本的TCPDF压缩包.因为里面包含了范例和字体,因此文件大概…
ABBYY FineReader 15(Windows系统)新增智能PDF文档转换功能,可自动检测导入PDF数字文档的文本层质量,确保转变为可编辑格式后的准确结果:从表单字段和文本框中提取文本,准确保留交互式PDF形式字段. ABBYY FineReader 15 OCR文字识别软件中的OCR 编辑器可让用户检查识别区域.验证识别出的文本.预处理图像以提高 OCR精确性等等. 图-1 ABBYY FineReader 15 单击打开选项卡,然后左键单击转换为PDF.Microsoft Word.…
ICEpdf 是一个轻量级的开源 Java 语言的 PDF 类库.通过 ICEpdf 可以用来浏览.内容提取和转换 PDF 文档,而无须一些本地PDF库的支持. 可以用来做什么? 1.从pdf文件中提取所有的文字或信息,比如给pdf文档做摘要 2.把pdf转换成图片,这个功能非常的棒,比如给pdf文件做缩略图或者直接做一个纯js的pdf阅读器. 3.pdf文档的分页打印和信息搜索. 4.pdf中添加.修改或删除批注信息. 在pdf到图片转换方面,最好的开源产品. 官方地址:http://www.…
问题:PDF2SWF转换只有一页的PDF文档,在FlexPaper不显示! FlexPaper 与 PDF2SWF 结合是解决在线阅读PDF格式文件的问题的,多页的PDF文件转换可以正常显示,只有一页的PDF文件不能显示,我下了FlexPaper.PDF2SWF  N个版本都不行... 解决方法:在执行的命令后面加上“/usr/local/swftools/bin/pdf2swf  -T 9”转换成flash 9 格式即可解决~~ 知识点: SWFTools 是一组用来处理 Flash 的 sw…
文档管理系统中 ,扫描模块将文档或证件扫描后.为了便于保存多个图片,拟将多个图片生成一个PDF文档进行保存. 这里我们就需要PDF生成工具了.你可以在这里下载.PDFCreator 主要使用了开源工具ITextSharp生成PDF文档. 测试界面如下: 选择图片,可多选 生成PDF 生成的PDF文件: 目前只是生成图片的pdf文件,至于更高级的应用的探索,以后写文章再说吧. 其中关键代码PDFCreator如下 using System; using System.Collections.Gen…