简述

目前网上已经有很多种html文件直接转pdf的技术帖子，但是很少有直接将部分html作为段落插入到pdf中，而且也没有一个可以很好的解决中文显示的问题。

因此今天上午围绕这个问题进行了研究，把解决方案分享给大家。

itextpdf基础操作请访问：http://www.cnblogs.com/mvilplss/p/5640598.html

感谢：http://gridmix.blog.51cto.com/4764051/1229585

实现思路

如果想插入html片段，我们使用一个类的静态方法：

         String html = "<div style='color:green;font-size:20px;'>你好世界！hello world !</div>";

         Paragraph context = new Paragraph();

         ElementList elementList =XMLWorkerHelper.parseToElementList(htmlString, null);

         for (Element element : elementList) {

             context.add(element);

         }

         document.add(context);

不过你会发现不能显示中文，这个问题网上有很多种解决方法，但是都不好使。

查看XMLWorkerHelper.parseToElementList(htmlString, null)这个方法的源码，发现

CssAppliers cssAppliers = new CssAppliersImpl(FontFactory.getFontImp());可以进行字体的更换。

 public static ElementList parseToElementList(String html, String css) throws IOException {

         // CSS

         CSSResolver cssResolver = new StyleAttrCSSResolver();

         if (css != null) {

             CssFile cssFile = XMLWorkerHelper.getCSS(new ByteArrayInputStream(css.getBytes()));

             cssResolver.addCss(cssFile);

         }

         // HTML

         CssAppliers cssAppliers = new CssAppliersImpl(FontFactory.getFontImp());//这里可以下手对字体进行操作

         HtmlPipelineContext htmlContext = new HtmlPipelineContext(cssAppliers);

         htmlContext.setTagFactory(Tags.getHtmlTagProcessorFactory());

         htmlContext.autoBookmark(false);

         // Pipelines

         ElementList elements = new ElementList();

         ElementHandlerPipeline end = new ElementHandlerPipeline(elements, null);

         HtmlPipeline htmlPipeline = new HtmlPipeline(htmlContext, end);

         CssResolverPipeline cssPipeline = new CssResolverPipeline(cssResolver, htmlPipeline);

         // XML Worker

         XMLWorker worker = new XMLWorker(cssPipeline, true);

         XMLParser p = new XMLParser(worker);

         p.parse(new ByteArrayInputStream(html.getBytes()));

         return elements;

     }

因此我们就想到重写XMLWorkerFontProvider类的getFont(*)方法，对于没有显示声明css样式的字体，默认使用undefine字体样式进行设置默认字体。

 public class MyXMLWorkerHelper {

     public static class MyFontsProvider extends XMLWorkerFontProvider {

         public MyFontsProvider() {

             super(null, null);

         }

         @Override

         public Font getFont(final String fontname, String encoding, float size, final int style) {

             String fntname = fontname;

             if (fntname == null) {

                 fntname = "宋体";

             }

             return super.getFont(fntname, encoding, size, style);

         }

     }

     public static ElementList parseToElementList(String html, String css) throws IOException {

         // CSS

         CSSResolver cssResolver = new StyleAttrCSSResolver();

         if (css != null) {

             CssFile cssFile = XMLWorkerHelper.getCSS(new ByteArrayInputStream(css.getBytes()));

             cssResolver.addCss(cssFile);

         }

         // HTML

         MyFontsProvider fontProvider = new MyFontsProvider();

         CssAppliers cssAppliers = new CssAppliersImpl(fontProvider);

         HtmlPipelineContext htmlContext = new HtmlPipelineContext(cssAppliers);

         htmlContext.setTagFactory(Tags.getHtmlTagProcessorFactory());

         htmlContext.autoBookmark(false);

         // Pipelines

         ElementList elements = new ElementList();

         ElementHandlerPipeline end = new ElementHandlerPipeline(elements, null);

         HtmlPipeline htmlPipeline = new HtmlPipeline(htmlContext, end);

         CssResolverPipeline cssPipeline = new CssResolverPipeline(cssResolver, htmlPipeline);

         // XML Worker

         XMLWorker worker = new XMLWorker(cssPipeline, true);

         XMLParser p = new XMLParser(worker);

         html = html.replace("<br>", "").replace("<hr>", "").replace("<img>", "").replace("<param>", "")

                 .replace("<link>", "");

         p.parse(new ByteArrayInputStream(html.getBytes()));

         return elements;

     }

 }

因为XMLWork不支持html的单标签，所以要对但标签进行过滤。不然就会报错：Invalid nested tag div found, expected closing tag br

pdf文件之itextpdf插入html内容以及中文解决方案的更多相关文章

pdf文件之itextpdf操作实例
需求分析 1.需要创建一个pdf文件,包含文件的基本属性 2.文件需要包含附件,通过点击链接直接打开 3.生成的pdf文件不能直接修改(需要输入密码) 4.pdf文件需要有文字或图片水印准备jar包 ...
【电子签章】HTML格式合同转化成PDF文件
代码地址如下:http://www.demodashi.com/demo/12476.html 一.主要思路通过itextpdf 生成想要的pdf 文件通过itextpdf 中 XMLWorker ...
javaWeb项目springMVC框架下利用ITextpdf 工具打印PDF文件的方法（打印表单、插入图片）
方法一:打印PDF表单以及在PDF中加入图片需要的资料: jar包:iTextAsian.jar ,itext-2.1.7.jar: 源码: public static void main(Stri ...
【使用Itext处理PDF文档（新建PDF文件、修改PDF文件、PDF中插入图片、将PDF文件转换为图片）】
iText简介 iText是著名的开放源码的站点sourceforge一个项目,是用于生成PDF文档的一个java类库.通过iText不仅可以生成PDF或rtf的文档,而且可以将XML.Html文件转 ...
java操作office和pdf文件java读取word，excel和pdf文档内容
在平常应用程序中,对office和pdf文档进行读取数据是比较常见的功能,尤其在很多web应用程序中.所以今天我们就简单来看一下Java对word.excel.pdf文件的读取.本篇博客只是讲解简单应 ...
深入学习Python解析并解密PDF文件内容的方法
前面学习了解析PDF文档,并写入文档的知识,那篇文章的名字为深入学习Python解析并读取PDF文件内容的方法. 链接如下:https://www.cnblogs.com/wj-1314/p/9429 ...
深入学习python解析并读取PDF文件内容的方法
这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应 ...
网页中动态嵌入PDF文件/在线预览PDF内容https://www.cnblogs.com/xgyy/p/6119459.html
#网页中动态嵌入PDF文件/在线预览PDF内容# 摘要:在web开发时我们有时会需要在线预览PDF内容,在线嵌入pdf文件: 问题1:如何网页中嵌入PDF: 在网页中: 常用的几种PDF预览代码片段如 ...
#网页中动态嵌入PDF文件/在线预览PDF内容#
摘要:在web开发时我们有时会需要在线预览PDF内容,在线嵌入pdf文件: 问题1:如何网页中嵌入PDF: 在网页中: 常用的几种PDF预览代码片段如下: 代码片段1: 1 <object ty ...

随机推荐

初识Java反射
要详细的了解Java反射,就得要了解Java的类加载以及何为运行时动态加载等等概念.本文抛开其余概念,简单介绍Java反射,详细介绍会在以后有一个系统而全面的认识过后展开. 反射是Java被视为动态语 ...
第一个远程javaweb项目测试全过程
2017-5-20,在这个奇特的日子,我不再满足于在本地测试javaweb,于是在上腾讯云买了第一个云服务器,由于是学生认证,所以一个月只要10块钱,还是要抢的,每天早上9点开抢打开后,发现其实是一 ...
【CSS入门基础，有需要的看过来哦】心境，心静，不轻言放弃！---致CSS
整理一下近一周学习的有关CSS的基础知识笔记: CSS语法必须写在<style>标签中哦~/*注释*/ [CSS常用背景属性]background background-color:背景色 ...
冒泡排序的python代码实现
li = [33, 2, 10, 1,564,880,8,99,51,3]# for i in range(len(li) - 1):# current = li[i]# next_v ...
[HDU1001] Sum Problem
Problem Description Hey, welcome to HDOJ(Hangzhou Dianzi University Online Judge). In this problem, ...
Coursera 机器学习笔记（四）
主要为第六周内容机器学习应用建议以及系统设计. 下一步做什么当训练好一个模型,预测未知数据,发现结果不如人意,该如何提高呢? 1.获得更多的训练实例 2.尝试减少特征的数量 3.尝试获得更多的特征 ...
关于JS跨域问题的解决
这里不提供什么高深的代码了,只说明一个解决跨域问题的方法,个人觉得这个方法是最方便也是最有效的. 那就是一用不同源的JS,虽然JS不允许不同源的访问,但是可以引用不同源的JS,用这样的方法我们可以引用 ...
python基础操作_元组_字典操作
#元组'''元组是不可变的列表,不能改.取值和列表一样'''tp=(1,2,3)tp1=('127.0.0.1','3307')#元组只有count 和index两个方法.lis=['127.0.0. ...
javacv开发详解之1：调用本机摄像头视频（建议使用javaCV1.3版本）
javaCV系列文章: javacv开发详解之1:调用本机摄像头视频 javaCV开发详解之2:推流器实现,推本地摄像头视频到流媒体服务器以及摄像头录制视频功能实现(基于javaCV-FFMPEG.j ...
MyBatis源码分析之环境准备篇
前言之前一段时间写了[Spring源码分析]系列的文章,感觉对Spring的原理及使用各方面都掌握了不少,趁热打铁,开始下一个系列的文章[MyBatis源码分析],在[MyBatis源码分析]文章的 ...

pdf文件之itextpdf插入html内容以及中文解决方案

简述

实现思路

pdf文件之itextpdf插入html内容以及中文解决方案的更多相关文章

随机推荐

热门专题