在平常应用程序中,对office和pdf文档进行读取数据是比较常见的功能,尤其在很多web应用程序中.所以今天我们就简单来看一下Java对word.excel.pdf文件的读取.本篇博客只是讲解简单应用.如果想深入了解原理.请读者自行研究一些相关源码. 首先我们来认识一下读取相关文档的jar包: 1. 引用POI包读取word文档内容 poi.jar 下载地址 http://apache.freelamp.com/poi/release/bin/poi-bin-3.6-20091214.zip …
由于目前的工作跟office打交道比较多,所以才有了此篇blog,需求是实现word转换pdf方便页面展示.之前lz采用的是jacob(仅支持windows)进行转换的,但是现在服务器改成linux显然不能用了,于是网上搜罗一圈,最终决定采用LibreOffice.(前提:需要安装jdk环境) LibreOffice中文官网:https://zh-cn.libreoffice.org/   下载合适的版本,本文下载的是6.1.6 已上传百度网盘(链接: https://pan.baidu.com…
根据我的测试,LibreOffice转换文档到pdf乱码主要有三个方面的原因: 1.centos缺少中文字体 2.jdk缺少中文字体 3.LibreOffice缺少中文字体. 解决该问题需要将window下的字体copy到centos相应目录下. 原因1的解决方案参考 http://blog.csdn.net/u013132051/article/details/53514696 安装字体时可能出现失败的情况,可以不用管.字体安装完毕后需要重启soffice服务 原因2的解决方案需要将字体cop…
最近项目中遇到一个需求,将word.excel文件转换成pdf,并且打上水印,我利用的是libreoffice,这个需要Java 的jdk环境.废话不多说,开撸 1.在linux上搭建jdk环境 文章链接 https://www.cnblogs.com/houss/p/11694260.html 2.安装libreoffice所需的包(官网) 我下载的镜像下载网址 mkdir /usr/libreofficecd /usr/libreofficewget https://mirrors.tuna…
插入一个文件到页面中是能够让你将有用的文件,电子表格,幻灯片或者其他可用的文件在你小组中进行分享的好方法. 针对所有的文件类型,你可以选择以链接方式插入一个文件.缩略图将会对文档的内容进行预览同时可以对大小进行调整. 希望你预览一个 Office 或者 PDF 文件,单击链接或者缩略图来显示完整的预览(不需要 Excel,Word 或者 PowerPoint 安装在你的额电脑中).可选的,在预览界面中选择下载按钮来下载文件后进行离线方式预览. 你甚至可以进行  编辑 和 在 Office 和 P…
前提:本人的系统为Ubuntu 13.10 64位系统.本篇是我在配置好环境后一段时间写的,所以操作上可能会有也错误,因此仅供参考. 搜索在线显示office和pdf,最常见的方法就是把都转为swf,然后通过FlexPaper显示.这个方法有缺点,FlexPaper不支持所有浏览器(我只能在chrome中使用,firefox要进行设置) 我用的系统是Ubuntu 13.10 64位 一下所提到的软件,我都会在附件中分享 一.openoffice安装 下载附件中的Apache_OpenOffice…
ABBYY PDF Transformer+是一个新的,全面的巧妙解决PDF文档的工具,它将泰比的光学字符识别(OCR)技术和Adobe®PDF技术完美结合,以确保实现便捷地处理任何类型的PDF文件,帮助您提高日常工作效率.ABBYY PDF Transformer+支持的格式很多,小编给大家罗列了一下,希望对大家有所帮助. ABBYY PDF Transformer+输入格式 格式 描述 PDF PDF 1.3-1.7 DOC Microsoft Word 97-2003 Document D…
Pdf(Portable Document Format)意为“便携式文档格式”,是现在最流行的文件格式之一,它有很多优点如:尺寸较小.阅读方便.操作系统平台通用等,非常适合在网络上传播和使用.如今在我们的日常生活中已随处可见PDF文件的身影,例如产品说明.电子图书.网络资料.电子邮件等,PDF文件已被越来越多的人使用.但在使用过程中,我们会发现一个问题,那就是我们很难对PDF文件进行文本和格式编辑.而一直以来,MS Word 都是最流行的文字处理程序.因此有些时候为了方便编辑,我们通常会将PD…
在js内生成PDF文件并下载的功能实现(不调用后端),以及生成pdf时换行的格式不被渲染,word-break:break-all 前天来了个新需求, 有一个授权书的文件要点击下载, 需要在前端生成, 以前没做过那就开始查资料吧,还真的发现有生成pdf文件的组件(此处感谢前辈们写的组件),叫做 jspdf. 然后还有一个把页面渲染成画布的插件,叫做 html2canvas, 那好,开心写吧. 但是首先这两个插件的导包就让我头疼, 因为网上的例子大多数都是js标签导包的,而我们用的是react框架…
其实libreoffice有好多功能,完全可以替代office 1.windows下将word转为pdf 1  安装libreoffice 到官网下载后安装即可.https://donate.libreoffice.org/ 安装完成后目录: 其实安装完我们发现其有好多功能,现在介绍几个重要的功能. soffice.exe --- 类似于一个全收录功能,双击可以新建好多格式文本. sweb.exe---类似于一个html的编辑器,可以编辑好多文件,可能与notpad++更像. scalc.exe…