使用abcpdf将html转换成pdf文件
ABCpdf.NET使用介绍
最新做一个项目需要生成pdf文档以供打印,研究决定使用abcpdf这款组件,先针对其使用方法做一个简单的总结介绍以给有需要的朋友做参考。
一、 ABCpdf.NET简单介绍
ABCpdf.NET是一个能够很方便生成pdf的.net组件,能够运行在以下操作系统中:Windows 2000, Windows XP, Windows Server 2003, Windows Vista, and Windows Server 2008.官方建议运行环境安装IE6或者以上版本。对应不同的系统,它有32位和64位的版本,使用时注意版本的选用。 ABCpdf的功能比较多,比如可以读word、excel等文件,可以保存pdf、xps、swf等格式文件。本文主要介绍其生成pdf的方法。使用时,需要ABCpdf.DLL和ABCpdfCE7.DLL支持。其中ABCpdf.DLL(.net调用接口)需要引用到项目中,ABCpdfCE7.DLL(核心驱动)放在ABCpdf.DLL的同一目录下即可。 ABCpdf的坐标系采用Adobe PDF标准坐标系,原点在屏幕的左下角,采用72DPI(我们用的通常是96DPI,在计算大小时注意转换,网页面上的96px相当于ABCpdf里面72px)
二、 入门,生成第一个pdf文件
这一节将通过实例来展示如何用ABCpdf.NET生成pdf文件。在使用前需要引入ABCpdf.DLL,在代码中引用名空间:using WebSupergoo.ABCpdf7;通常情况下只需要引入这个名空间就可以了。
Code:
private void GeneratePdfTest1()
{
using (Doc theDoc = new Doc())
{
theDoc.Rect.Inset(, ); //Rect默认是文档整个页面大小, 这里的Inset表示将Rect左右留出24的空白,上下留出48的空白
theDoc.Color.String = "32,48,117";
theDoc.FrameRect();//为当前rect添加边框
theDoc.MediaBox.String = "0 0 590 840";//设置添加新页面时,页面的大小
theDoc.Rect.String = "14 14 576 770";//当前输出区间
theDoc.Color.String = "192,48,117";
theDoc.FrameRect();
theDoc.FontSize = ;
theDoc.AddText("Hello World");
theDoc.Font = theDoc.AddFont("宋体", "ChineseS");
theDoc.FontSize = ;
theDoc.Flatten();//合并pdf各个layer,减少pdf大小
theDoc.Save(Server.MapPath("simple.pdf"));
theDoc.Clear();
}
}
上面的代码可以简单的生成一个pdf文件。
三、 进阶,控制生成的pdf
上面的代码只是简单的生成了一个pdf,很多细节问题都没有说明,现在将介绍如何控制生成的pdf和介绍一些有用的方法。比如页面的大小、字体、添加的内容位置等。 WebSupergoo.ABCpdf7.Doc类有很多属性和方法可以利用,这里我们就要用到:
1. SetInfo方法 virtual void SetInfo(int id, string type, string value) 用来获取或者改变pdf页面各对象的外观情况,id通过getinfo方法可以获取。 e.g.默认的pdf页面大小是a4页面大小,可以用这个方法来改变当前页面的大小。 theDoc.SetInfo(theDoc.Page, "/MediaBox:Rect", "0 0 200 300");
2. Rect属性 这是一个很重要的属性,abcpdf里面生成pdf的基本思路就是先确定一个rect再向该rect里里面添加内容,所有的pdf对象都依赖rect,用rect来定位的。 e.g.在指定位置添加文字。 theDoc.Rect.String = "14 14 576 770"; theDoc.AddText("Hello World"); 当然,可以在添加文字前设置字体和颜色等信息: theDoc.Font = theDoc.AddFont("宋体", "ChineseS"); theDoc.FontSize = 12; theDoc.Color.String = "192,48,117";
3. MediaBox属性 设置MediaBox属性只会影响后面添加的页面大小,后面添加的页面大小将会是MediaBox设置的大小。它不会影响已存在的页面大小。改变已存在页面大小用setinfo方法。
4. Layer属性 获取或设置当前层,和html的层是一样的,前面的层会覆盖后面的层。默认的Layer为1,在最前面。
AddHtml添加html代码(将会被解析,但此方法不支持css)支持以下html标记:
<Head> <Body>
<BR> <P> <H1> to <H6> <List>
<UL> <OL> <LI> <A> <B>
<I> <U> <Strike> <Sup> <Sub>
<Font> <StyleRun> <BlockQuote>
<Pre> e.g.Code: Doc theDoc = new Doc(); theDoc.FontSize = 72; theDoc.AddHtml("<b>Gallia</b> est omnis divisa in partes tres, quarum unam incolunt <b>Belgae</b>, aliam <b>Aquitani</b>, tertiam qui ipsorum lingua <b>Celtae</b>, nostra <b>Galli</b> appellantur."); theDoc.Save(Server.MapPath("docaddhtml.pdf")); theDoc.Clear();
5. AddImageHtml方法 virtual int AddImageHtml(string html) virtual int AddImageHtml(string html, bool paged, int width, bool disableCache) html 需要添加的html paged 是否分页,true启用分页 width 页面的宽度(浏览器解析html时浏览器的宽度) disableCache 是否忽略缓存,true不启用缓存,false启用缓存,缓存时间5分钟 return 返回添加的html对象id 说明:这个方法和AddImageUrl基本上是一样的,只不过这个直接用的html,AddImageUrl用的是url地址。这个方法将用传入的html生成一个临时文件,然后解析该临时文件来为pdf添加相关内容。这个是一个很简单的方法,它不提供任何性能上的提升。如果是在asp.net中使用,需要IIS拥有对临时文件夹的完全访问权限,否则将会出现错误。如果html内含有外部的样式和图片,则需要用绝对地址,因为传入的html没有具体的地址,将会无法解析其包含的相对地址。如果必须用相对地址,请用AddImageUrl方法。 e.g.Code: Doc theDoc = new Doc(); using (StreamReader sReader = new StreamReader(Server.MapPath("s.html"))) { theDoc.AddImageHtml(sReader.ReadToEnd(),true,760,true); }
6. AddImageUrl方法 virtual int AddImageUrl(string url) virtual int AddImageUrl(string url, bool paged, int width, bool disableCache) 参数说明同上,只不过是将html换成了url。 说明:通过这个方法可以很方便的将一个web page添加到pdf文件,其解析web page用的是ie的内核(版本估计和机器上安装的版本相关,有兴趣可以利用css测试一下)。值得注意的一个问题是pdf的dpi是72,通常html的dpi是96,所以如果要pdf上显示的和浏览器上看到的一样大,那么在设置rect大小(会填满所设置的rect)的时候需要用width参数乘以72/96。
e.g.Code:
Doc theDoc = new Doc();
theDoc.AddImageUrl("http://www.google.com/");
theDoc.Save(Server.MapPath("htmlimport.pdf"));
theDoc.Clear();
四、 进阶,如何分页
在利用html转pdf的时候,通常都会遇到的问题。abcpdf会进行智能的分页,而分页的实现也只需要几行代码。
int theID = theDoc.AddImageUrl("http://localhost:1141/WebSitePDF/000001.OF.html", true, 760, true); //以下实现多页效果
while (true) {
theDoc.FrameRect();//画Rect的边框
if (!theDoc.Chainable(theID))
break;
theDoc.Page = theDoc.AddPage();
theID = theDoc.AddImageToChain(theID);
} 如果需要在分页时不对模块进行截断,请为相应模块添加打印样式“page-break-inside: avoid”如果需要在指定位置进行强制分页,请添加:“<div style="page-break-before:always"> </div>”其中“ ”是必须要的。经过我的实验此强制分页标记并不是任何时候都分页的,用之前注意针对指定的html代码进行测试。推荐用自动分页+保证模块完整性样式。 对于需要设置页眉和页脚的,也很简便,只要将页面分成三个rect(页眉,页脚,中间内容),分页的时候将内容添加到中间的rect,分页完毕后再分别补充页面,页脚。
e.g.Code: theDoc.Rect.String = "14 35 576 803"; int theID = theDoc.AddImageUrl(url, true, 760, true); //以下实现多页效果 while (true) { if (!theDoc.Chainable(theID)) break; theDoc.Page = theDoc.AddPage(); theID = theDoc.AddImageToChain(theID); }
for (int i = 1; i <= theDoc.PageCount; i++) { theDoc.PageNumber = i; ////表头 theDoc.Rect.String = "14 803 576 835"; theDoc.AddImageUrl(urlTop, false, 760, true); ////表尾 theDoc.Rect.String = "14 35 576 5"; theDoc.AddImageUrl(urlBottom, false, 760, true); }
五、 运行js,js支持 abcpdf支持html页面脚本JavaScript,这让我们利用html生成pdf时多了一个利器,可以通过js改变html,再生成pdf。如何执行页面上的js呢?下面将介绍几个相关的属性。注意这个受运行机器浏览器安全设置限制,如果浏览器安全级别很高或者限制了js的运行,在调用js的时候将会报错:Unable to apply JScript Windows error 5. Access is denied.
1. theDoc.HtmlOptions.UseScript 是否启用脚本,默认为false不启用
2. theDoc.HtmlOptions.OnLoadScript 当启用脚本时,页面载入后执行的脚本,可以是一段js代码,也可以是html页面包含函数方法
3. theDoc.HtmlOptions.HostWebBrowser 是否启用WebBrowser,默认为false不启用。只有在启用了WebBrowser后,left, top, width, height, offsetLeft, offsetTop, offsetWidth, offsetHeight, clientLeft, clientTop, clientWidth, clientHeight, pixelLeft, pixelTop, pixelWidth, pixelHeight, posLeft, posTop, posWidth, and posHeight这些dom方法才可用,否则都是0。在启用WebBrowser后,还可以用用xml,xslt。
e.g.Code: theDoc.HtmlOptions.UseScript = true; theDoc.HtmlOptions.HostWebBrowser = true; theDoc.HtmlOptions.OnLoadScript ="var divs=document.getElementById('content').childNodes;if(divs[0].scrollHeight<divs[1].scrollHeight)divs[0].style.height=divs[1].scrollHeight;";
六、 关于程序发布注册 对于发布程序,需要在创建doc对象前注册一些该组件的key,如下: XSettings.InstallRedistributionLicense(" 注册码"); Doc doc = new Doc(); Response.Write("License: " + doc.License + "<br>"); 或者 Doc theDoc = new Doc(); // here we use a trial license key as copied from the PDFSettings application theDoc.SetInfo(0, "License", "cd9b5c07db69df2bf57c0a04d9bca58b10c44889c9fb197984e592f49addfce5ec5fe85d7b9205bc"); Response.Write(theDoc.GetInfo(0, "License")); 在程序引入的dll版本要和打包的版本一致,否则会出现找不到xx版本dll的错误,编译时将dll的版本号也包含进去了,大概是因为该dll是强命名的原因。
使用abcpdf将html转换成pdf文件的更多相关文章
- Nodejs 中将html转换成pdf文件
Nodejs 中将html转换成pdf文件,Nodejs Convert html into pdf 1. 下载phantomjs.exe,将该文件放在根目录 2. 编写pdf.js文件(在githu ...
- OpenOffice将MS docx转换成pdf文件偶数页眉不显示问题解决办法
OpenOffice版本:4.0(Windows.Linux下测试都出现问题) MS Office版本:2007 问题描述 使用OpenOffice将MS的docx文件转换为pdf文件时,docx文件 ...
- Linux不用使用软件把纯文本文档转换成PDF文件的方法
当你有一大堆文本文件要维护的时候,把它们转换成PDF文档会好一些.比如,PDF更适合打印,因为PDF文档有预定义布局.除此之外,还可以减少文档被意外修改的风险. 要将文本文件转换成PDF格式,你要按照 ...
- C# 将PowerPoint文件转换成PDF文件
PowerPoint的优势在于对演示文档的操作上,而用PPT查看资料,反而会很麻烦.这时候,把PPT转换成PDF格式保存,再浏览,不失为一个好办法.在日常编程中和开发软件时,我们也有这样的需要.本文旨 ...
- C#.net word excel powerpoint (ppt) 转换成 pdf 文件
using System;using System.Collections.Generic;using System.ComponentModel;using System.Data;using Sy ...
- 在Linux下将HTML文件转换成PDF文件
今天要写一个上交的作业,本来是想用Office Word来写的,但是,我的Office貌似不能用了,但是,Linux下的LibreOffice写出的文档,在打印的时候是经常出现乱码的.所以,后来想到可 ...
- Python将word文档转换成PDF文件
如题. 代码: ''' #將word文档转换为pdf文件 #用到的库是pywin32 #思路上是调用了windows和office功能 ''' #导入所需库 from win32com.client ...
- 用java代码把docx转换成pdf文件
import java.io.IOException; import java.io.InputStream; import java.io.OutputStream; import java.nio ...
- 转换成CSV文件、Word、Excel、PDF等的方法--读取CSV文件的方法
1. 转换成CSV文件: http://www.dotnetgallery.com/lab/resource93-Export-to-CSV-file-from-Data-Table-in-Aspne ...
随机推荐
- apache 2.4目录权限
apache 2.4 好象不再支持以下指令...Order allow,denyAllow from all 用上面的指令访问页面时显示错误:client denied by server confi ...
- 14_Java面向对象_第14天(Eclipse高级、类与接口作为参数返回值)_讲义
今日内容介绍 1.Eclipse常用快捷键操作 2.Eclipse文档注释导出帮助文档 3.Eclipse项目的jar包导出与使用jar包 4.不同修饰符混合使用细节 5.辨析何时定义变量为成员变量 ...
- Android自定义View实现仿QQ实现运动步数效果
效果图: 1.attrs.xml中 <declare-styleable name="QQStepView"> <attr name="outerCol ...
- [转]string和stringstream用法总结
转自:http://blog.csdn.net/xw20084898/article/details/21939811 作者:xw20084898 一.string string 是 C++ 提供的字 ...
- PHP学习心得2
对于PHP的语法结构,刚开始真的很不习惯,真搞不懂为什么每个变量之前都要加个“$”符号,每个语句写完之后都必须加上“分号”来表示此句已经结束,还有,PHP对字母的大小写是敏感的,写的时候一定要注意大小 ...
- leetcode动态规划
http://blog.csdn.net/u012162613/article/details/41428119
- PHP面试经常被提到的问题
1. Include 与 require的区别,require和require_once的效率哪个高? PHP在遇到include时就解释一次,如果页面中出现10次include,php就解释10次, ...
- Install .Net Core For CentOS
Install .NET Core SDK Before you start, please remove any previous versions of .NET Core from your s ...
- 【大数据】关于Kafka的进一步理解
前置: 文件host 192.168.11.13 192.168.11.14 192.168.11.30 脚本init_kafka.sh #!/bin/bash source /etc/profile ...
- 文件同步工具 lsyncd2.1.6 安装使用问题
项目有文件实时同步备份的需求,做了一下调查,比较好的解决方法是使用lsyncd工具.这里主要记录一下遇到的问题及解决方法. lsyncd 的相关介绍和对比可见: lsyncd实时同步搭建指南——取代r ...