POI-word转html

 package com.test.poiword;

 import android.app.Activity;

 import android.os.Bundle;

 import android.webkit.WebSettings;

 import android.webkit.WebView;

 import com.test.poiword.utils.FileUtils;

 import org.apache.poi.hwpf.HWPFDocument;

 import org.apache.poi.hwpf.converter.PicturesManager;

 import org.apache.poi.hwpf.converter.WordToHtmlConverter;

 import org.apache.poi.hwpf.usermodel.Picture;

 import org.apache.poi.hwpf.usermodel.PictureType;

 import org.w3c.dom.Document;

 import java.io.BufferedWriter;

 import java.io.ByteArrayOutputStream;

 import java.io.File;

 import java.io.FileInputStream;

 import java.io.FileNotFoundException;

 import java.io.FileOutputStream;

 import java.io.IOException;

 import java.io.OutputStreamWriter;

 import java.util.List;

 import javax.xml.parsers.DocumentBuilderFactory;

 import javax.xml.transform.OutputKeys;

 import javax.xml.transform.Transformer;

 import javax.xml.transform.TransformerFactory;

 import javax.xml.transform.dom.DOMSource;

 import javax.xml.transform.stream.StreamResult;

 /**

  *

  */

 public class WordHtmlActivity extends Activity {

     //文件存储位置

     private String docPath = "/mnt/sdcard/doc/";

     //文件名称

     private String docName = "word3.doc";

     //html文件存储位置

     private String savePath = "/mnt/sdcard/doc/";

     @Override

     protected void onCreate(Bundle savedInstanceState) {

         super.onCreate(savedInstanceState);

         setContentView(R.layout.html);

         String name = docName.substring(0, docName.indexOf("."));

         try {

             convert2Html(docPath + docName, savePath + name + ".html");

         } catch (Exception e) {

             e.printStackTrace();

         }

         //WebView加载显示本地html文件

         WebView webView = (WebView)this.findViewById(R.id.office);

         WebSettings webSettings = webView.getSettings();

         webSettings.setLoadWithOverviewMode(true);

         webSettings.setSupportZoom(true);

         webSettings.setBuiltInZoomControls(true);

         webView.loadUrl("file:/"+savePath+name+".html");

     }

     /**

      * word文档转成html格式

      * */

     public void convert2Html(String fileName, String outPutFile) {

         HWPFDocument wordDocument = null;

         try {

             wordDocument = new HWPFDocument(new FileInputStream(fileName));

             WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(

                     DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());

             //设置图片路径

             wordToHtmlConverter.setPicturesManager(new PicturesManager() {

                 public String savePicture(byte[] content,

                                           PictureType pictureType, String suggestedName,

                                           float widthInches, float heightInches) {

                     String name = docName.substring(0, docName.indexOf("."));

                     return name + "/" + suggestedName;

                 }

             });

             //保存图片

             List<Picture> pics=wordDocument.getPicturesTable().getAllPictures();

             if(pics!=null){

                 for(int i=0;i<pics.size();i++){

                     Picture pic = (Picture)pics.get(i);

                     System.out.println( pic.suggestFullFileName());

                     try {

                         String name = docName.substring(0,docName.indexOf("."));

                         String file = savePath+ name + "/"

                                 + pic.suggestFullFileName();

                         FileUtils.makeDirs(file);

                         pic.writeImageContent(new FileOutputStream(file));

                     } catch (FileNotFoundException e) {

                         e.printStackTrace();

                     }

                 }

             }

             wordToHtmlConverter.processDocument(wordDocument);

             Document htmlDocument = wordToHtmlConverter.getDocument();

             ByteArrayOutputStream out = new ByteArrayOutputStream();

             DOMSource domSource = new DOMSource(htmlDocument);

             StreamResult streamResult = new StreamResult(out);

             TransformerFactory tf = TransformerFactory.newInstance();

             Transformer serializer = tf.newTransformer();

             serializer.setOutputProperty(OutputKeys.ENCODING, "utf-8");

             serializer.setOutputProperty(OutputKeys.INDENT, "yes");

             serializer.setOutputProperty(OutputKeys.METHOD, "html");

             serializer.transform(domSource, streamResult);

             out.close();

             //保存html文件

             writeFile(new String(out.toByteArray()), outPutFile);

         } catch (Exception e) {

             e.printStackTrace();

         }

     }

     /**

      * 将html文件保存到sd卡

      * */

     public void writeFile(String content, String path) {

         FileOutputStream fos = null;

         BufferedWriter bw = null;

         try {

             File file = new File(path);

             if(!file.exists()){

                 file.createNewFile();

             }

             fos = new FileOutputStream(file);

             bw = new BufferedWriter(new OutputStreamWriter(fos,"utf-8"));

             bw.write(content);

         } catch (FileNotFoundException fnfe) {

             fnfe.printStackTrace();

         } catch (IOException ioe) {

             ioe.printStackTrace();

         } finally {

             try {

                 if (bw != null)

                     bw.close();

                 if (fos != null)

                     fos.close();

             } catch (IOException ie) {

             }

         }

     }

 }

http://poi.apache.org/apidocs/overview-summary.html

POI-word转html的更多相关文章

Apache POI Word基本使用
Apache POI Word 1.什么是Apache POI? Apache POI是一个流行的API,使用Java程序创建,修改和显示MS-Office文件. 它是由Apache Software ...
【POI word】使用POI实现对Word的读取以及生成
项目结构如下: 那第一部分:先是读取Word文档 package com.it.WordTest; import java.io.FileInputStream; import java.io.Fil ...
POI Word 模板文字图片替换
实验环境:POI3.7+Word2007 Word模板: 替换后效果: 代码: 1.入口文件 public class Test { public static void main(String[] ...
Java POI Word 写文档
package apache.poi; import java.io.ByteArrayInputStream;import java.io.ByteArrayOutputStream;import ...
poi word 转html (.DOC .DOCX )
注:不支持图片,支持表格 package com.bjhy.platform.report.commons; import java.io.BufferedWriter; import java.io ...
POI实现word文档转html文件
POI word文件转html package com.feiruo.officeConvert; import java.io.BufferedWriter; import java.io.File ...
poi操作word文档文件操作
import org.apache.poi.POITextExtractor; import org.apache.poi.hwpf.extractor.WordExtractor; //得到.doc ...
poi 读取word 遍历表格和单元格中的图片
背景项目需要解析word表格需要批量导入系统,并保存每行信息到数据库并且要保存word中的图片, 并保持每条信息和图片的对应关系一行数据可能有多条图片解决办法没有找到现成的代码,怎么办呐? ...
简单poi操作word@2020
个人采用POI(3.16版本)一.段落部分XWPFParagraph paragraph = docxDocument.createParagraph();1.段落对齐方式paragraph.setA ...
Java解析word,获取文档中图片位置
前言(背景介绍): Apache POI是Apache基金会下一个开源的项目,用来处理office系列的文档,能够创建和解析word.excel.ppt格式的文档. 其中对word文档的处理有两个技术 ...

随机推荐

Flask实战第57天：UEditor编辑器集成以及配置上传文件到七牛
相关链接 UEditor:http://ueditor.baidu.com/website/ 下载地址:http://ueditor.baidu.com/website/download.html# ...
luogu P2485 [SDOI2011]计算器
题目描述你被要求设计一个计算器完成以下三项任务: 1.给定y.z.p,计算y^z mod p 的值: 2.给定y.z.p,计算满足xy ≡z(mod p)的最小非负整数x: 3.给定y.z.p,计算 ...
Manacher算法总结
部分图片转自:http://www.cnblogs.com/grandyang/p/4475985.html manacher算法(民间称马拉车算法233)是用来找字符串中的最长回文子串的,先来说一下 ...
[Codeforces-div.1 55D] Beautiful numbers
[Codeforces-div.1 55D] Beautiful numbers 试题分析还是离散化...\(f_{i,j,k}\)表示i位,gcd为j,余数为k. #include<iost ...
【二项式定理】【推导】计蒜客17115 2017 ACM-ICPC 亚洲区（西安赛区）网络赛 B. Coin
题意:投一枚硬币向上的概率是q/p.问你投K枚硬币,向上的枚数为偶数枚的概率是? 要求的即为. 这个东西是个二项展开式的偶数项系数和,来,我们复习一下高中数学,设f(x)=(ax+b)^n,则其偶数项 ...
window下命令行的方式安装svn服务端
下载Binary Packages类型的安装文件 https://www.visualsvn.com/server/download/ 自己选择版本第一步 :开始安装到 c:/software ...
(转)CString,int,string,char*之间的转换
CString,int,string,char*之间的转换http://www.cnblogs.com/greatverve/archive/2010/11/10/cstring-int-string ...
关于 js 中的回调函数 callback
本文写于1年前曾经的学习文章如今拿出来分享前言其实我一直很困惑关于js中的callback,困惑的原因是,学习中这块看的资料少,但是平时又经常见,偶尔复制一下前人代码,功能实现了也就不再去追其原 ...
express-session的简单使用说明
我们知道Internet 通过协议分为stateful和stateless两类,而http是stateless协议,客户端发送请求到服务端建立一个连接,请求得到响应后连接即中断,服务器端不会记录状态, ...
XMPP资源绑定(Resource Binding)与单台设备登录控制
原文:http://blog.csdn.net/brasbug/article/details/26353511 一个XMPP的账号由三部分组成: 用户名(user/node),域名(domain)和 ...

POI-word转html

POI-word转html的更多相关文章

随机推荐

热门专题