基于url-to-pdf-api构建docker镜像,制作一个网页另存服务
基于url-to-pdf-api构建docker镜像,制作一个网页另存服务
业务背景:
需要根据一个url路径打印这个网页的内容
解决方案:
1.使用wkhtml2pdf
2.使用puppeteer
根据网上的资料,wkhtml2pdf 可以安装在linux服务器,通过java api调用linux命令即可使用。但似乎对SPA(单页面应用)支持不是很好。puppeteer是谷歌出品,可以模拟谷歌引擎,支持SPA,打印效果较好。
源代码下载
下载url-to-pdf-api源代码(https://github.com/alvarcarto/url-to-pdf-api)
本地安装node环境即可测试网页打印。但是这个服务需要安装至linux服务器,需要安装node并且通过npm install 安装node_modules,较复杂,使用docker打包成镜像可以解决这个问题。
docker镜像制作
开始时,我的Dockerfile写法是这样的
FROM node:latest
WORKDIR /app
# copy package.json into the new directory
COPY package.json /app
# install the dependencies
RUN npm install
# copy all other files into the app directory
COPY . /app
#配置环境变量
ENV HOST 0.0.0.0
ENV PORT 9005
ENV NODE_ENV production
ENV ALLOW_HTTP true
ENV DEBUG_MODE false
# open port 9000
EXPOSE 9005
# run the server
CMD node ./src/index.js
#CMD [ "npm", "start"]
但是我在启动镜像实例之后,测试无法使用,查看镜像实例日志,关键的一行错误信息如下:
Error: Failed to launch the browser process
通过网上的资料,我发现和我问题相似的博客:https://www.jianshu.com/p/2c88eb7459a4
根据该博客,我修改了Dockerfile,内容如下:
FROM node:latest
# 注意改 source-sans-pro.zip
COPY ./source-sans-pro-3.006R/ /usr/share/fonts/
RUN sed -i 's/deb.debian.org/mirrors.163.com/g' /etc/apt/sources.list && \
apt update && \
apt-get install -y dpkg wget unzip
# 2. https://github.com/puppeteer/puppeteer/blob/master/.ci/node10/Dockerfile.linux
RUN apt-get update && \
apt-get -y install xvfb gconf-service libasound2 libatk1.0-0 libc6 libcairo2 libcups2 \
libdbus-1-3 libexpat1 libfontconfig1 libgcc1 libgconf-2-4 libgdk-pixbuf2.0-0 libglib2.0-0 \
libgtk-3-0 libnspr4 libpango-1.0-0 libpangocairo-1.0-0 libstdc++6 libx11-6 libx11-xcb1 libxcb1 \
libxcomposite1 libxcursor1 libxdamage1 libxext6 libxfixes3 libxi6 libxrandr2 libxrender1 libxss1 \
libxtst6 ca-certificates fonts-liberation libappindicator1 libnss3 lsb-release xdg-utils wget && \
rm -rf /var/lib/apt/lists/*
# create a directory to run docker
WORKDIR /app
# copy package.json into the new directory
COPY package.json /app
# install the dependencies
RUN npm install
# copy all other files into the app directory
COPY . /app
#配置环境变量
ENV HOST 0.0.0.0
ENV PORT 9005
ENV NODE_ENV production
ENV ALLOW_HTTP true
ENV DEBUG_MODE false
# open port 9000
EXPOSE 9005
# run the server
CMD node ./src/index.js
#CMD [ "npm", "start"]
通过如下链接测试使用:
http://localhost:9005/api/render?url=https://www.baidu.com
出现问题,截图中的中文都是小方框,乱码。应该是中文字体不正确。
可以使用两种方式解决:
1.启动镜像实例后,使用docker cp复制中文字体至镜像内,重启实例
2.启动实例时挂载宿主机字体目录到镜像实例字体目录
我选择了第二种方式解决,我的docker 启动镜像实例命令如下:
docker run -itd -p 9005:9005 -v /usr/share/fonts:/usr/share/fonts --name url2pdf-v6 docker-url2pdf:v6
镜像导出
由于,需要在其他宿主机中安装该镜像,可以使用docker save导出镜像
先将镜像文件保存为tar文件
docker save -o docker-url2pdf.tar docker-url2pdf:v6
使用该命令后,会在当前目录下产生一个docker-url2pdf.tar 文件,但该文件很大,不利于网络传输,可以使用gzip命令进一步压缩
使用gzip压缩文件
gzip docker-url2pdf.tar
压缩完成后将文件传输到宿主机后解压文件
gunzip docker-url2pdf.tar.gz
导入镜像即可使用,导入镜像命令如下:
docker load < docker-url2pdf.tar
还未解决的问题:
url-to-pdf-api 在使用的时候支持很多参数,也支持cookie。但是我们在传递cookie时没有成功,暂不
参考链接:
https://github.com/alvarcarto/url-to-pdf-api
https://www.jianshu.com/p/2c88eb7459a4
https://github.com/puppeteer/puppeteer/blob/main/docs/troubleshooting.md#running-puppeteer-in-docker
注意点:
需要找到以下代码并注释掉
page.on('console', (...args) => logger.info('PAGE LOG:', ...args));
该代码会打印大量日志,影响性能
基于url-to-pdf-api构建docker镜像,制作一个网页另存服务的更多相关文章
- 「Spring Boot 2.4 新特性」一键构建Docker镜像
背景 在我们开发过程中为了支持 Docker 容器化,一般使用 Maven 编译打包然后生成镜像,能够大大提供上线效率,同时能够快速动态扩容,快速回滚,着实很方便.docker-maven-plugi ...
- Docker:使用Jenkins构建Docker镜像
Docker 彭东稳 1年前 (2016-12-27) 10709次浏览 已收录 0个评论 一.介绍Jenkins Jenkins是一个开源项目,提供了一种易于使用的持续集成系统,使开发者从 ...
- 构建Docker镜像两种方式的比较-Dockerfile方式和S2I方式
前言 写Dockerfile是构建Docker镜像最通常的方式,接触过Docker的童鞋多少了解一些.前段时间研究OpenShift(paas的一种),发现了另外一种构建Docker镜像的方式:S2I ...
- 使用docker Maven插件本地构建docker镜像并发布到远程服务器
1.登录网站https://start.spring.io/,生成一个基本的SpringBoot应用. 2.将应用导入Eclipse IDE并创建Application类.目录结构如下: Applic ...
- Maven插件构建Docker镜像
背景 微服务架构下,微服务在带来良好的设计和架构理念的同时,也带来了运维上的额外复杂性,尤其是在服务部署和服务监控上.单体应用是集中式的,就一个单体跑在一起,部署和管理的时候非常简单,而微服务是一个网 ...
- [转] 构建Docker镜像两种方式的比较-Dockerfile方式和S2I方式
原文地址:https://www.cnblogs.com/tianshifu/p/8127837.html 前言 写Dockerfile是构建Docker镜像最通常的方式,接触过Docker的童鞋多少 ...
- 使用Buildpacks高效构建Docker镜像
1. 前言 Spring Boot 2.3.0.RELEASE 正式发布了几天了,其中有个新的特性:可以将Spring Boot应用代码直接打包为Docker镜像.这是什么科技?我赶紧去官网查了一番才 ...
- 如何构建Docker镜像
构建Docker 镜像有如下两种方法: (一)使用docker commit命令.(二)使用docker build命令和 Dockerfile 文件.在这里并不推荐使用docker commit来构 ...
- 多阶段构建Docker镜像
在Docker 17.05及更高的版本中支持支持一种全新的构建镜像模式:多阶段构建: 多阶段构建Docker镜像的最大好处是使构建出来的镜像变得更小: 目前常见的两个构建镜像的方式为: 1.直接使用某 ...
随机推荐
- 关于Java注解(annotation)的简单理解
一.什么是注解? 从 JDK5 开始,Java增加对元数据的支持,也就是注解.简单理解就是代码里的特殊标志,这些标志可以在编译,类加载,运行时被读取,并执行相应的处理,以便于其他工具补充信息或者进行部 ...
- [ICPC 2018 宁夏邀请赛] A-Maximum Element In A Stack(思维)
>传送门< 前言 辣鸡网络赛,虽然我是个菜鸡,然而好几个队伍十几分钟就AK???我心态那会彻底崩了,后来群里炸了,话题直接上知乎热搜,都是2018ICPC宁夏网络赛原题,这怎么玩,拼手速? ...
- P4718 [模板]Pollard-Rho算法
对一个大质数进行质因数分解 需要引用miller-robin来判素数 一直写的gcd居然挂掉了... 以后用__gcd了 #include <bits/stdc++.h> using na ...
- 2019牛客暑期多校训练营(第六场)J Upgrading Technology
传送门 题意: 就是给你n个技能,每个技能最高升到m级,每升一级就是耗费Cij钱,这个Cij可能是负的,如果所有技能都升到或者说超过j等级,就会获得Dj钱,这个Dj也有可能是负值,让你求你最多得到多少 ...
- Manacher算法 & Palindrome
马拉车用于解决最长回文子串问题,重点是子串,而不是子序列,时间复杂度为O(n). 解释一下变量的意义: Len[i]数组去存第i个位置到mx位置的长度 id记录上一次操作的位置(这个操作可以看模板) ...
- CodeForces - 220B 离散化+莫队算法
莫队算法链接:传送门 题意: 有n个数,m个区间.问区间内有多少个x,x满足x的个数等于x的值的个数(如果x是3,区间内要存在3个3). 题解: 因为a[i]太大,所以要离散化一下,但是不能用map容 ...
- Java魔法堂:调用外部程序
前言 Java虽然五脏俱全但总有软肋,譬如获取CPU等硬件信息,当然我们可以通过JNI调用C/C++来获取,但对于对C/C++和Windows API不熟的码农是一系列复杂的学习和踩坑过程.那能不能通 ...
- 导出Excel出错
错误提示: 解决方法: 1.运行dcomcnfg打开组件服务. 2.依次展开"组件服务"->"计算机"->"我的电脑"-&g ...
- python--通过ocr对数据可视化视频还原为csv,进行简单的分析
见github https://github.com/TouwaErioH/Machine-Learning/tree/master/video/video 题目描述: source https:// ...
- C# 特殊符号
特殊符号 @开头 前面提到过,字符串里免转义用的, 字符串里写的啥就是啥,遇到\ 不转义 ?? 判断一个值是不是null,是的话就变成后面的默认值,不是的话就还是原值 $开头 字符串篡改 和forma ...