利用Pandoc将markdown文件转化为pdf

准备工作

安装pandoc

Windows下安装pandoc很容易,直接从pandoc官网上下载最新安装包安装即可。
Linux下的安装可以参考阳志平的博文1

安装MiKTeX

pandoc被称为格式转换的瑞士军刀2。执行程序文件只有20M左右大小,但是能够在几十种文件格式之间自如的转换,那当然是得依赖各种格式文件所需要库。转换为pdf就要用到MiKTeX,Windows下推荐使用CTeX完整版,对中文的支持很好,可以从CTeX官网下载完整套件

将markdown文件转换为pdf

如果markdown文件中不包含中文字符,那么直接使用下面的命令就可以将markdown文件无缝转换为Latex支持的pdf文件。

pandoc infile.md -o outfile.pdf

如果markdown文件中包含中文字字符,那么上段命令就无法直接转换,可能会报以下错误:

! Package inputenc Error: Unicode char \u8:鍒?not set up for use with LaTex.
pandoc: Error producing PDF from Tex source.
See the inputsnc package documentation for explanation.
...

为了解决中文编译的问题,需要做以下的工作:

  1. 将markdown文档的编码方式改为utf-8。比较简单的办法就是用记事本打开该文档,然后另存为时选择编码方式为utf-8。有可能当你改变编码方式后,文档中的中文全变成乱码了。为避免这种情况,可以在改变编码方式之前先复制文档的全部内容,然后在改变编码方式之后粘贴替换文档中的全木内容,这样就不会出现乱码了。
  2. 编译pandoc默认的latex引擎是pdflatex,是不支持中文的,因此需要手动设置编译时所用的引擎为xelatex,编译命令改为:
    pandoc infile.md -o outfile.pdf --latex-engine=xelatex

  3. 这时编译可能没有错误了,但是得到的pdf文档中可能所有的中文都没有了。这是字体的问题,因为编译时默认的字体时不支持中文的,所以我们得手动设置中文字体。显然,所设的字体应该为系统中已装的字体,且字体的名字不能写错。有一个办法可以的到系统中所安装的所有字体名(见博文),即在控制台中输入命令:fc-list >> C:\fonts.txt。这样,扫到的字体信息就全部被导入到C盘根目录下的fonts.txt文件中了。这里我们选择宋体,字体名称为“SimSun”,于是编译命令改为:
    pandoc infile.md -o outfile.pdf --latex-engine=xelatex -V mainfont="SimSun"
    注意:命令中的``V’’是大写
    这里字体名也可以不加引号,但是如果字体名比较复杂(如包含空格)时,不加双引号就可能出错。
  4. 好了,中文字符应该能够显示了,但是你可能会发现很多文字已经超出了文档的边界无法显示了,这是因为pandoc对中文的支持不太好,不能自动换行。但是这并不表示pandoc就真的无法完美处理中文文档了,因为技术界那些追求完美的极客们为我们提供了无限的可能。这篇博文介绍了pandoc中文pdf转换攻略3,解决方案是使用网友编辑好的latex模板来生成pdf,这里用到的是tzengyuxio提供的pm-template.latex4。 下载模板后将其中的LiHei Pro字体替换成系统中安装有的中文字体即可,然后编译命令改为:
    pandoc infile.md -o outfile.pdf --latex-engine=xelatex -template=pm-template.latex
    注意:如果安装的MiKTeX(我用的是CTex)宏包不全,编译可能会出问题,如找不到exp13.sty等,因此推荐安装完整版的MiKTex。
    当然,你也可以使用自己定义的模板来生成tex和pdf文件。首先使用命令 pandoc -D latex > my.latex 生成一个默认的模板,在对这个模板进行修改,如字体、自动换行等。


  1. Markdown写作进阶:Pandoc入门浅谈: http://www.yangzhiping.com/tech/pandoc.html

  2. 黑魔法利器pandoc: http://yanping.me/cn/blog/2012/03/13/pandoc/

  3. pandoc中文pdf转换攻略:http://afoo.me/2013-07-10-how-to-transform-chinese-pdf-with-pandoc.html

  4. pm-template GitHub: https://github.com/tzengyuxio/pages/tree/gh-pages/pandoc


 


利用Pandoc将markdown文件转化为pdf的更多相关文章

  1. [原创]使用Pandoc实现Markdown文件转PDF文件

    Markdown写法简单明快,我十分喜欢,以至于我最近都想使用Markdown快速的进行测试说明书的写作,但是考虑到这文档是要进行交接的,一个.md的文件在内部传输还是有不便,于是就想到了能不能把Ma ...

  2. 将caj文件转化为pdf文件进行全文下载脚本(ubuntu下亲测有用)

    最近ubuntu下caj阅读器,突然崩掉了,而偏偏要准备开题,在网上搜索原因未果,准备放弃时候,突然在网上看到一个脚本,说是很好用,可以在指定页面将caj文件转化为pdf文件,亲测有用,这里直接给出脚 ...

  3. c# 将dwg文件转化为pdf

    https://blog.csdn.net/mywaster/article/details/50220379 最近做一个项目,要求将dwg文件转化为pdf,开发工具VS2010 + AutoCad ...

  4. 利用 Pandoc 将 Markdown 生成 Word/PDF 文件

    Pandoc 是一个格式转化工具,可以用于各(luan)种(qi)各(ba)样(zao)的文件转换, 反正我是认不全官网上的那个图(傲娇脸), 之前一直使用它将 Markdown 文件转换成 Html ...

  5. 为什么一些公司把dwg文件转化为pdf

    是因为dwg文件中可能会涉及到字体问题 这台电脑打开dwg没问题,另一台电脑可能没有相应的字体用autocad打开就会出现乱码,所以先转化为pdf,而pdf有固定格式的作用,能够保证一台电脑打开是什么 ...

  6. C#利用iTextSharp将datatable数据转化为PDF文件

    1.下载iTextSharp.dll文件 下载链接:https://pan.baidu.com/s/14o-pJ-U2yU8n0EyIn249qg 提取码:tklu 2.PDF转换方法 /// < ...

  7. C++ 利用 libxl 将 Excel 文件转化为 Xml 文件

    在游戏开发工作中,策划和运营一般会用Excel来编写配置文件,但是程序读取配置,最方便的还是xml文件.所以最好约定一个格式,然后在二者之间做一个转化. 本文利用libxl来读取Excel文件,利用 ...

  8. Markdown 文件转化为work文档

    1. 电脑安装pandoc 链接:https://pan.baidu.com/s/12H5wLO0JWph5TjrbeJI6mg 密码:ssgs 下载安装包解压即可用.记得配置系统环境变量 2.命令行 ...

  9. windows环境下 php 将office文件(word/excel/ppt)转化为pdf(转)

    将office文件转化为pdf的方法有 1.利用openoffice提供的服务 (比较简单,但是转化的效果不太好) 2.使用office提供的服务 (注:这在windows服务器上,并且服务器上面安装 ...

随机推荐

  1. 前端程序员:月薪 5K 到 5 万

    入行行头:5 大硬件 请准备好以下东西 一颗人类的大脑:智商在平均水平线以上即可 一份强烈的渴望:我的代码要可以运行在任何一个有浏览器的设备上. 一台笔记本电脑:不需要花费很多钱得那种,只要它可以运行 ...

  2. Hotel---poj3667(线段树区间问题)

    题目链接:http://poj.org/problem?id=3667 题意:酒店有n个房间,现有m个团队,每个团队需要连续 d 个房间,现在有两个操作,1:需要 d 个房间,2:从 x 开始连续 d ...

  3. Android中的Handler及它所引出的Looper、MessageQueue、Message

    0.引入 0.1.线程间通信的目的 首先,线程间通信要交流些什么呢? 解答这个问题要从为什么要有多线程开始,需要多线程的原因大概有这些 最早也最基本:有的任务需要大量的时间,但其实并不占用计算资源,比 ...

  4. POJ1144:Network(无向连通图求割点)

    题目:http://poj.org/problem?id=1144 求割点.判断一个点是否是割点有两种判断情况: 如果u为割点,当且仅当满足下面的1条 1.如果u为树根,那么u必须有多于1棵子树 2. ...

  5. 关于ML的思考讲座-周zh-11.30日

    1.深度神经网络 1.以往神经网络采用单或双隐层结构,虽然参照了生物上的神经元,但是从本质上来说还是数学,以函数嵌套形成. 2.通常使用的激活函数是连续可微(differentiable)的,sigm ...

  6. cocos代码研究(26)Widget子类RichView学习笔记

    理论部分 一个显示多个RichElement的容器类. 我们可以使用它很容易显示带图片的文本,继承自 Widget. 代码实践 static RichText * create ()创建一个空的Ric ...

  7. pyDay12

    内容来自廖雪峰的官方网站. 1.可迭代对象(Iterable):可以直接作用于for循环的对象. 2.集合数据类型:如list.tuple.dict.set.str等. 3.generator:包括生 ...

  8. Python3.x:os.chdir(改变当前路径方法)介绍

    Python3.x:os.chdir(改变当前路径方法)介绍 1,os.chdir() import os os.chdir(r'C:\python36\test_chdir') 说明:chdir() ...

  9. [UI基础][实现]九宫格之应用程序管理

    [目标] 1.完成下图所示的View,View中的图片.文字数据从app.list文件读出. 2.思考代码哪里可以进行优化. [分析] 1.创建控件 整个View分12个部分,其中包含一个 UIIma ...

  10. Qt+json

    Json文件是这样: { "first fruit": { "describe":"an apple", "icon": ...