用phantomjs 进行网页整页截屏

写截取整个网页程序是一个做前台的哥们所托，要做一些漂亮的界面原形，参考一些不错的网站设计就帮他弄了个截屏的程序。

phantomjs 是一个基于js的webkit内核无头浏览器也就是没有显示界面的浏览器，这样访问网页就省去了浏览器的界面绘制所消耗的系统资源，比较适合用于网络测试等应用。我只是调用了其中的一个截取网页的小功能，可以完美的解析网页的js和css 而且兼容html5，不过最新的1.5版本不支持flash，所以我采用了1.4的版本，能够得到完整的网页体验。

先看看执行的效率（4M电信，22：30点测试）：

phantomjs的目录结构

dll挺多的都是必须的 codecs里面包含编码信息 qcncodecs4.dll 这个是中文支持里面还有韩文日文和台湾繁体中文这玩意必须有要不然会出现乱码的。

imageformats目录里面是qgif4.dll和qjpeg4.dll两个dll 是用于图片转换的默认png格式。

rasterize.js 就是官方写好的截屏的js代码

var page = require('webpage').create(),

    address, output, size;

if (phantom.args.length < 2 || phantom.args.length > 3) {

    console.log('Usage: rasterize.js URL filename [paperwidth*paperheight|paperformat]');

    console.log('  paper (pdf output) examples: "5in*7.5in", "10cm*20cm", "A4", "Letter"');

    phantom.exit();

} else {

    address = phantom.args[0];

    output = phantom.args[1];

    page.viewportSize = { width: 600, height: 600 };

    if (phantom.args.length === 3 && phantom.args[1].substr(-4) === ".pdf") {

        size = phantom.args[2].split('*');

        page.paperSize = size.length === 2 ? { width: size[0], height: size[1], border: '0px' }

                                           : { format: phantom.args[2], orientation: 'portrait', border: '1cm' };

    }

    page.open(address, function (status) {

        if (status !== 'success') {

            console.log('Unable to load the address!');

        } else {

            window.setTimeout(function () {

                page.render(output);

                phantom.exit();

            }, 200);

        }

    });

}

看这个js的意思貌似可以将pdf文件转换为图片文件，我没有测试。我调用的时候只是传了两个参数。

下面的就算调用的核心js代码直接输出图像文件。

page.render(output);

在C#中调用这玩意的代码是：

private void GetImage(string url) {

            string links = url.IndexOf("http://") > -1 ? url : "http://" + url;

            #region 启动进程

            Process p = new Process();

            p.StartInfo.FileName = Environment.CurrentDirectory+"//phantomjs.exe";

            p.StartInfo.WorkingDirectory = Environment.CurrentDirectory+"//pic//";

            p.StartInfo.Arguments = string.Format("--ignore-ssl-errors=yes --load-plugins=yes " + Environment.CurrentDirectory + "//rasterize.js  " + links + " "+url+".png");

            p.StartInfo.CreateNoWindow = true;

            p.StartInfo.WindowStyle = ProcessWindowStyle.Hidden;

            if (!p.Start())

                throw new Exception("无法Headless浏览器.");

            #endregion

        }

关键是这里

p.StartInfo.Arguments = string.Format("--ignore-ssl-errors=yes --load-plugins=yes " + Environment.CurrentDirectory + "//rasterize.js  " + links + " "+url+".png");

--ignore-ssl-errors=yes 忽视加密的ssl连接错误

--load-plugins=yes 载入插件

上面的两参数可以不用 ，加上了是为了体验真实的网页体验效果，比如，不载入插件的话 flash就不会加载的。

Environment.CurrentDirectory + "//rasterize.js  " 这里就是调用写好的js驱动代码，下面带上的参数是作用于这个js的。

links  访问的网址连接，最好加入http：//。

"+url+".png 输出的图片 默认是png格式 当包含了上面 imageformats里面的dll的话 就可以输出jpg格式和gif格式的图片。

所有代码就这样子的，用起来很简单，就像在代码中调用cmd一样的。这样就很容易在不错的机子上进行多线程的批量截图而不影响任何操作，效率方面还很不错！

后面附上截取 www.sina.com 网站效果：

默认png的图片效果还是很不错的

用phantomjs 进行网页整页截屏的更多相关文章

C#使用phantomjs 进行网页整页截屏
C#使用phantomjs 进行网页整页截屏 hantomjs 是一个基于js的webkit内核无头浏览器也就是没有显示界面的浏览器,这样访问网页就省去了浏览器的界面绘制所消耗的系统资源,比较适合用 ...
js利用clipboardData在网页中实现截屏粘贴的功能
目前仅有高版本的 Chrome 浏览器支持这样直接粘贴,其他浏览器目前为止还无法粘贴,不过火狐和ie11浏览器在可编辑的div中能够粘贴截图的图片也是base64位和Chrome利用clipboard ...
利用 clipboardData 在网页中实现截屏粘贴的功能
<!DOCTYPE HTML> <html lang="en-US"> <head> <meta charset="UTF-8& ...
利用Chrome开发者工具功能进行网页整页截图的方法
第一步:打开chrome开发者工具. 打开你想截图的网页,然后按下 F12(macOS 是 option + command + i)调出开发者工具,接着按「Ctrl + Shift + P」(mac ...
chrome实现网页高清截屏(F12、shift+ctrl+p、capture)
打开需要载屏的网页,在键盘上按下F12,出现以下界面上图圈出的部分有可能会出现在浏览器下方,这并没有关系.此时按下 Ctrl + Shift + P(Mac 为 ⌘Command +⇧Shift + ...
chrome开发者工具实现整站截屏
我们经常要遇到将整个网站作为图片保存下来的情况,而windows系统自带的PrintScreen键只能保存当前屏幕的截图在chrome浏览器中可以安装第三方的截图插件实现整站截图今天我们要介绍的方 ...
Snipaste强大离线/在线截屏软件的下载、安装和使用
步骤一: https://zh.snipaste.com/ ,去此官网下载. 步骤二:由于此是个绿色软件,直接解压即可. 步骤三:使用,见官网.ttps://zh.snipaste.com 按F1 ...
php结合phantomjs实现网页截屏、抓取js渲染的页面
首先PhantomJS快速入门 PhantomJS是一个基于 WebKit 的服务器端 JavaScript API.它全面支持web而不需浏览器支持,其快速,原生支持各种Web标准: DOM 处理, ...
利用PhantomJS进行网页截屏，完美解决截取高度的问题
关于PhantomJS PhantomJS 是一个基于WebKit的服务器端 JavaScript API.它全面支持web而不需浏览器支持,其快速,原生支持各种Web标准: DOM 处理, CSS ...

随机推荐

（转）CSS 禁止浏览器滚动条的方法
1.完全隐藏在里加入scroll="no",可隐藏滚动条: 这个我用的时候完全没效果,不知道是什么原因!不过好多人说这么用可以,大概是用的位置不一样吧 2.在不需要时隐 ...
HTML解析利器 - HtmlAgilityPack
HtmlAgilityPack 是CodePlex 上的一个开源项目.它提供了标准的DOM API 和XPath 导航--即使 HTML 不是适当的格式! 使用HtmlAgilityPack操作HTM ...
探索A@1db9742
public class S { /** * @param args */ public static void main(String[] args) { System.out.printl ...
No-args constructor for class does not exist. Register an InstanceCreator with G
有时候我们在使用Googel官方的json解析包时,如果自己的实体类中出现代参的构造函数.在1.4的jar中,如果类造型中有参数,就会调用不了无参构造器,(如:HashMap的构造器就会有参数) 参考 ...
MySQL中的两个时间函数，用来做两个时间之间的对比
TIMESTAMPDIFF,(如果当期时间和之前时间的分钟数相比较.大于1天,即等于1:小于1天,则等于0) select TIMESTAMPDIFF(DAY,'2016-11-16 10:13:42 ...
jquery 获取多个dom对象的方法
$("[name=trade]").each(function(){ for(j=0;j<info.trade.length;j++){ if( $(this).val() ...
正则匹配<img src="xxxxxx" alt="" />标签的相关写法
1.(<img\ssrc[^>]*>) 2.content.replace(/<img [^>]*src=['"]([^'"]+)[^>]*&g ...
开心菜鸟系列－－－－函数作用域（javascript入门篇）
1 <!DOCTYPE html> 2 <html> 3 <script src="./jquery-1.7.2.js"></ ...
cf C. Magic Formulas
http://codeforces.com/contest/424/problem/C #include <cstdio> #include <cstring> #includ ...
微软推荐的Get a code signing certificate流程和链接
Get a code signing certificate Before you can establish a Windows Dev Center hardware dashboard ac ...

用phantomjs 进行网页整页截屏

用phantomjs 进行网页整页截屏的更多相关文章

随机推荐

热门专题