本篇作为一个备忘,记录一下html转pdf中遇到的问题。

没有具体做这个东西的时候不知道,网络上能将html转换成pdf的资源并不太多,使用上有很多都存在一些问题。能完美将一个站点中的页面(这里说一个站点中的页面是指非特意制作只包含简单html元素的网页)转换成pdf的很多都是收费的项目。

这里不讨论itextsharp,因为我们指明了源是html页面,itextsharp对html的支持比较鸡肋,他的灵活体现在手动绘制pdf上。

我们的系统中原本使用了Pechkin这款开源产品,这款产品使用简单,而且转换出来的pdf与原页面看不出来差别。但Pechkin依赖于很多32位dll,这样应用程序必须运行在32位进程中。

为了使程序运行在64位进程中,尝试了很多,最后发现这个项目:https://github.com/vilppu/OpenHtmlToPdf

OpenHtmlToPdf与Pechkin的内部原理一样,都是封装了wkHtmlToPdf来实现的转换。

wkHtmlToPdf内部包含了一个浏览器引擎:Webkit,所以它能对html页面的还原比较真实,官方上看wkHtmlToPdf还曾发布过使用其他浏览器引擎的分支项目,有兴趣的话也可以去尝试一下。

OpenHtmlToPdf内部包含了32位和64位wkHtmlToPdf两个应用程序,使用命令的方式去调用不同的exe,以此来实现在两种进程中兼容。

其还提供了丰富的调用参数可供使用:http://wkhtmltopdf.org/libwkhtmltox/pagesettings.html

当然,因为wkhtmltopdf本身就是比较老的项目了,这里面有些参数我尝试后并没有得到什么效果。

使用示例:

using (WebClient wc = new WebClient())
{
wc.Encoding = Encoding.UTF8;
string html = wc.DownloadString(url); var document = Pdf.From(html)
.OfSize(OpenHtmlToPdf.PaperSize.LetterRotated)
.WithGlobalSetting("margin.top", "0.4cm");
if (IntPtr.Size == )
{
document = document.WithObjectSetting("load.zoomFactor", "1.5");
}
var result = document.Content(); HttpContext.Current.Response.Clear();
HttpContext.Current.Response.AddHeader("content-disposition", "attachment;filename=PDF" + DateTime.Now.ToString("yyyyMMddhhmmss") + ".pdf");
HttpContext.Current.Response.ContentType = "application/octet-stream";
HttpContext.Current.Response.BinaryWrite(result);
HttpContext.Current.Response.End();
}

这个东西使用中也遇到一些问题。

看代码可以发现在32位进程的时候,我对文档做了特殊处理,使用load.zoomFactor做了放大。

因为使用中发现其在32位中生成的pdf比64位中生成的pdf小了一些,我并没能找到和直接解决这个诡异的问题,最后找了这个放大的参数(这个应该是对浏览器引擎操作的参数),使其在两种环境中生成的pdf尺寸基本一致。。

当然,其实我们一般用不到一个web程序支持两种cpu进程,这只是为了在开发调试阶段使不同的开发者环境呈现的内容一致。

关于html转pdf的更多相关文章

  1. C#给PDF文档添加文本和图片页眉

    页眉常用于显示文档的附加信息,我们可以在页眉中插入文本或者图形,例如,页码.日期.公司徽标.文档标题.文件名或作者名等等.那么我们如何以编程的方式添加页眉呢?今天,这篇文章向大家分享如何使用了免费组件 ...

  2. 在线浏览PDF之PDF.JS (附demo)

    平台之大势何人能挡? 带着你的Net飞奔吧!:http://www.cnblogs.com/dunitian/p/4822808.html#skill 下载地址:http://mozilla.gith ...

  3. .NET平台开源项目速览(16)C#写PDF文件类库PDF File Writer介绍

    1年前,我在文章:这些.NET开源项目你知道吗?.NET平台开源文档与报表处理组件集合(三)中(第9个项目),给大家推荐了一个开源免费的PDF读写组件 PDFSharp,PDFSharp我2年前就看过 ...

  4. C#如何在PDF文件添加图片印章

    文档中添加印章可以起一定的作用,比如,防止文件随意被使用,或者确保文档内容的安全性和权威性.C#添加图片印章其实也有很多实现方法,这里我使用的是免费的第三方软件Free Spire.PDF,向大家阐述 ...

  5. C#中如何创建PDF网格并插入图片

    这篇文章我将向大家演示如何以编程的方式在PDF文档中创建一个网格,并将图片插入特定的网格中. 网上有一些类似的解决方法,在这里我选择了一个免费版的PDF组件.安装控件后,创建新项目,添加安装目录下的d ...

  6. 在Asp.Net中操作PDF – iTextSharp - 使用表格

    使用Asp.Net生成PDF最常用的元素应该是表格,表格可以帮助比如订单或者发票类型的文档更加格式化和美观.本篇文章并不会深入探讨表格,仅仅是提供一个使用iTextSharp生成表格的方法介绍 使用i ...

  7. 开源免费且稳定实用的.NET PDF打印组件itextSharp(.NET组件介绍之八)

    在这个.NET组件的介绍系列中,受到了很多园友的支持,一些园友(如:数据之巅. [秦时明月]等等这些大神 )也给我提出了对应的建议,我正在努力去改正,有不足之处还望大家多多包涵.在传播一些简单的知识的 ...

  8. ASP.Net MVC——使用 ITextSharp 完美解决HTML转PDF(中文也可以)

    前言: 最近在做老师交代的一个在线写实验报告的小项目中,有这么个需求:把学生提交的实验报告(HTML形式)直接转成PDF,方便下载和打印. 以前都是直接用rdlc报表实现的,可这次牵扯到图片,并且更为 ...

  9. 在禅道中实现WORD等OFFICE文档转换为PDF进行在线浏览

    条件: 安装好禅道的服务器 能直接浏览PDF的浏览器(或通过 安装插件实现 ) 文档转换服务程序(建议部署在另一台服务器上)     实现 原理: 修改禅道的文件预览功能(OFFICE文档其使用的是下 ...

  10. 一年之计在于春,2015开篇:PDF.NET SOD Ver 5.1完全开源

    前言: 自从我2014年下半年到现在的某电商公司工作后,工作太忙,一直没有写过一篇博客,甚至连14年股票市场的牛市都错过了,现在马上要过年了,而今天又是立春节气,如果再不动手,那么明年这个无春的年,也 ...

随机推荐

  1. CSS 的定位方式和含义

    CSS 的定位方式和含义 总结一下 CSS 的定位方式.CSS 的定位 position 是处理页面布局时非常重要的属性. CSS 中有 3 种基本的定位机制:普通流.浮动和绝对定位. 在没有指定的情 ...

  2. 解决UIScrollView把uitableviewcell的点击事件屏蔽

    cell中 [self.contentView addSubview:self.scrollView]; self.scrollView.userInteractionEnabled = NO; [s ...

  3. 安装ionic出现node-sass无法下载的解决方法

    解决方法: 修改C:\users\[用户名]下的.npmrc文件: registry=https://registry.npm.taobao.org sass-binary-site=https:// ...

  4. 【搬运】systemctl 命令完全指南

    Systemctl是一个systemd工具,主要负责控制systemd系统和服务管理器. Systemd是一个系统管理守护进程.工具和库的集合,用于取代System V初始进程.Systemd的功能是 ...

  5. sql中datetime 和 timestamp

    datetime 1.允许为空值,可以自定义值,系统不会自动修改其值. 2.不可以设定默认值,所以在不允许为空值的情况下,必须手动指定datetime字段的值才可以成功插入数据. 3.虽然不可以设定默 ...

  6. 网络适配器输入的IP地址 已经分配给另一个适配器

    解决步骤:1.开始-运行-cmd2. set devmgr_show_nonpresent_devices=123.set devmgr_show_nonpresent_devices=14.star ...

  7. 3.MongoDB下Windows下的安装

    由于博主目前使用的是Windows的系统,没有使用Linux等其它的系统,因此此安装配置和开发使用,均是在Windows下进行的,以后在使用其它的系统的时候,再将其它系统的配置的使用补充上来. 1.下 ...

  8. URL跳转的几种方式

    1.HTML: ①. <head> <!-- 以下方式只是刷新不跳转到其他页面 --> <meta http-equiv="refresh" cont ...

  9. XAF 如何基于业务规则禁用属性

    // Developer Express Code Central Example: // How to: Disable Property Editors Based on a Business R ...

  10. python学习笔记之常用模块(第五天)

    参考老师的博客: 金角:http://www.cnblogs.com/alex3714/articles/5161349.html 银角:http://www.cnblogs.com/wupeiqi/ ...