转自:http://blog.csdn.net/chinapi_hzh/article/details/5798689 因为微软没有公开word源代码,所以直接用java流来读取word的后果是读出来的全是乱码.所以必须通过jacob这个中间桥 .当然也可用poi来读取.     先说用poi读取的方法吧.用poi读取的话,先要下载tm-extractors-0.4.jar百度一下可以找到.代码如下: import java.io.FileInputStream; try { FileInput…
本文介绍通过Java后端程序代码来读取Word文本和段落格式的方法. 本次测试环境如下: Word版本:2013 编译环境:IntelliJ IDEA2018 Work库:free spire.doc.jar 3.9.0 JDK版本:1.8.0 通过textrange.getCharacterFormat()方法读取文本字符串格式,通过paragraph.getFormat()读取段落格式,读取具体文字及段落属性时,可支持读取字体.字号.文字颜色.文字背景.文字是否加粗或倾斜.文字下划线.大小写…
首先呢,先说一下制作freemarker模板步骤, 1. 在WPS上写出所要的下载的word格式当做模板 2. 把模板内不固定的内容(例:从数据库读取的信息)写成123或者好代替的文字标注 3. 把固定模板另存为htm或者html格式 4. 用文本编辑器(例:EditPlus,HBuilder等工具)打开模板,并将标注内容替换成 ${要获取的字段} 这种格式,类似于传参数,可以传多个参数 5. 将修改后的模板保存,并将后缀名改为ftl格式.至此  我们的freemarker模板就大功告成了 PS…
1.下载poi的jar包 下载地址:https://www.apache.org/dyn/closer.lua/poi/release/bin/poi-bin-3.17-20170915.tar.gz 下载解压后用到的jar包,这些包都能在下载的文件夹中找到 2.代码 //package com.word; import java.io.*; import java.io.File; import java.io.FileInputStream; import java.io.InputStre…
1.部署项目的服务器上必须安装WPS或Word office: 2.将jacob.jar文件放入%JAVA_HOME%\jre中: 3.将.dll文件放入%JAVA_HOME%\jre\bin中: 4.同时将.dll文件放入C:\Windows\System32中:…
import org.apache.poi.hwpf.HWPFDocument; import org.apache.poi.hwpf.model.StyleDescription; import org.apache.poi.hwpf.model.StyleSheet; import org.apache.poi.hwpf.usermodel.Paragraph; import org.apache.poi.hwpf.usermodel.Range; import java.io.*; pub…
从今天开始,我也要养成记录开发中遇到的问题和解决方法的好习惯! 最近开发一个Android项目,需要用到查看Word和Pdf文档的功能,由于Android没有直接显示Word和PDF文档的组件,只有一个Webview能查看html网页,所以决定将文档于服务器端转换为html,之后不论是在线预览还是下载到移动终端都可以直接查看了. 最近在网上查阅相关资料,找到利用Jacob来转换Word为html,除了占用CPU性能多一些,好像还不错(.doc和.docx都可以转换的!).废话不多说,切入正题,这…
暂时只写读取word内容的方法. 依赖的jar: poi-3.9-20121203.jarpoi-ooxml-3.9-20121203.jarxmlbeans-2.3.0.jar package com.word; import java.io.File; import java.io.FileInputStream; import java.io.InputStream; import org.apache.poi.POIXMLDocument; import org.apache.poi.P…
一:环境搭建 OpenOffice 下载地址http://www.openoffice.org/ JodConverter 下载地址http://sourceforge.net/projects/jodconverter/files/JODConverter/ 解压后将目录下的所有jar包放在工程的lib下面或者采用引用的方式调用这些jar包. 下载后安装,我安装的路径为D:/openOffice/install/ 二:启动服务 可以通过cmd调用服务, " cd D:/openOffice/i…
前言 最近需要做一些NLP 方面的工作,使用的是Java,在此总结一下使用Java读取Word(.doc)格式文件的方法. Apache基金会非常厉害,开源工具包POI就可以处理微软家的文档,甚至包括Excel和PowerPoint.我们就使用POI来做. 步骤 下载 https://poi.apache.org/download.html 下载Binary Distribution,并解压 导入 在Intellij IDEA中,点击File--Project Structure--Librar…