对扫描的pdf文件生成目录
很多pdf文件是直接扫描生成的,于是它的内容都是一张张的图片,当然就更没有目录索引了。
有的时候想找某些内容,只能一点点的移动滚动条,非常不方便。
那么有什么方法能生成目录呢?
方法一:使用福昕pdf编辑器
福昕pdf编辑器使用PRC识别pdf文件,能将pdf文件转换为office文件,更是有目录制作的功能。
但是,亲测后发现:
- 也是最关键的问题,他需要money,也就是得升级为会员,才能使用图片识别功能。
- 目录制作倒是免费的,但它的目录主要是设置标签,对于目录没有分级功能,且需要一页一页翻的去添加,非常麻烦
总之,最后的制作非常不理想。
方法二:使用FreePic2Pdf
先看一下最终效果图:
我使用的是《同济大学高等数学第六版上册.pdf》,打开pdf的软件是2345看图王,也可以用chrome打开。
怎么样,效果是不是非常良好。
FreePic2Pdf这是一个图片转pdf文件,但主要使用的是它的更改pdf的功能。
至于下载地址就不提供了(因为没找到它的官网),网上一搜一堆,第三方下载地址很多的。
软件打开是这样子的:
这些功能都不需要,主要使用的是右下角的更改pdf,点开之后:
主要使用的就是这一部分的功能。
现在开始目录制作。
先解释一下上述标签的意思:
- 往PDF挂书签:就是为pdf文件添加目录。不过需要目录文件,下面会有介绍制作的方式。
- 从PDF取书签:就是从有目录的pdf文件中提取出目录文件。
- 需要操作的目录文件:就是需要添加目录的PDF文件。
- 存放接口的文件夹:就是目录文件,需要制作。
其他的按键一般没什么需要使用的。
制作目录需要一个目录文件,使用的是txt格式。
一、选择一个存放接口的文件夹
这个文件夹可以自己创建。
二,创建配置文件
选定文件夹之后,再点击创建文件夹右边的那个按钮,输入以下模板内容:
[Images] [Font]
Language=GBK
FontSize=
Margin=0.5 [Bkmk]
File=FreePic2Pdf_bkmk.txt
AddAsText=
ShowBkmk=
ShowAll=
BasePage= [Main]
ContentsPage=
TextPage=
保存。之后他就会在选定的文件夹下创建一个名为 FreePic2Pdf.itf 的文件。
三、创建目录文件
在这个文件夹下新建一个 FreePic2Pdf_bkmk.txt 文件。
这个文件就是目录文件,这里的目录需要自定义,它需要按照一定的格式:
一级目录\t页码
\t二级目录\t页码
\t\t三级目录\t页码
。。。
\t表示制表符,也就是TAB键。
例如:
这个文件可以用记事本写,也可以用notepad等等。
那么这些内容具体怎么去写呢?
这个就得看自己的电脑技能了。不过总的来说是以下几步:
1、识别目录文字
- 可以使用ABBYY软件识别,但是不建议,具体原因请自行入坑。
- 推荐的:使用网页百度翻译。没错,就是百度翻译,将目录图片粘贴上去,他就自动识别并将中文和英文翻译显示出来了。
至于目录的图片,你可以截图,也可以使用2345看图王软件,如下图:
直接就复制目录了,这样复制的目录完整一点。
2、目录制作
百度翻译的识别效果如下:
呃,没有换行,内容也有部分缺失,这些都是需要自己去修改。
那么如何将这些内容制作成需要的格式呢,这个。。。要么靠自己手动编辑,如果会正则表达式,可以节省一点时间。
注意:目录的页码是pdf文件的真实页码,而不是书上标志的那些页码,为了方便,可以将接口文件中 BasePage 字段修改为书中第一页对应的pdf页数。
如:BasePage=12
制作成功后,选择相应的文件,如下图:
再点击开始,没问题的话瞬间制作完成。制作前记得先保存副本。
接着再点开pdf文件,就会发现目录有了:
到此,制作完成!!!
对扫描的pdf文件生成目录的更多相关文章
- C#/VB.NET 在Word转PDF时生成目录书签
当我们在转换Word文档到PDF格式时,想保留Word文档的标题作为PDF书签,那么应该如何操作呢?那么本文将以C#及VB.NET代码为例,介绍如何在Word转PDF时生成目录书签.下面是具体方法和步 ...
- 为Markdown文件生成目录
缘由 思路 效果 代码实现 缘由 Markdown源生文件源生不支持目录,目前比较主流的生成目录的方式(各式插件),都是转化为HTML文件.虽然HTML文件可以生成眼花缭乱的目录,但是修改起来又没有M ...
- 为 github markdown 文件生成目录(toc)
业务需要 在编写 github 项目时,有时候会编写各种 README.md 等 markdown 文件,但是 github 默认是没有目录的. 于是就自己写了一个小工具. markdown-toc ...
- ios开发之--PDF文件生成
写项目的时候,碰到一个需求,就是在手机端根据指定的文件内容生成PDF文件,并可以保存到手机上,因为以前只是听说过,没有真正的去了解过这个需求,通过查阅资料,可以实现这个功能,话不多说,代码如下: -( ...
- GitHub README文件生成目录导航
效果 环境说明 [root@C61 ~]# cat /etc/redhat-release CentOS release 6.10 (Final) [root@C61 ~]# uname -a Lin ...
- QT生成PDF文件
QString temp=""; //m_File_Content_Text_Edit->selectAll(); QString t_File_Content = m_Fi ...
- Pdf File Writer 中文应用(PDF文件编写器C#类库)
该文由小居工作室(QQ:2482052910) 翻译并提供解答支持,原文地址:Pdf File Writer 中文应用(PDF文件编写器C#类库):http://www.cnblogs.com/ ...
- C# Parsing 类实现的 PDF 文件分析器
下载示例 下载源代码 1. 介绍 这个项目让你可以去读取并解析一个PDF文件,并将其内部结构展示出来. PDF文件的格式标准文档可以从Adobe那儿获取到. 这个项目基于“PDF指南,第六版,Adob ...
- .NET平台开源项目速览(16)C#写PDF文件类库PDF File Writer介绍
1年前,我在文章:这些.NET开源项目你知道吗?.NET平台开源文档与报表处理组件集合(三)中(第9个项目),给大家推荐了一个开源免费的PDF读写组件 PDFSharp,PDFSharp我2年前就看过 ...
随机推荐
- 2018-2019-2 网络对抗技术 20165227 Exp2 后门原理与实践
2018-2019-2 网络对抗技术 20165227 Exp2 后门原理与实践 (1)例举你能想到的一个后门进入到你系统中的可能方式? 接收邮件的方式 (2)例举你知道的后门如何启动起来(win及l ...
- yum安装包另存
yum install --downloadonly --downloaddir=/tmp <package-name> 1.yum已安装的列表 yum list installed
- linux笔记_day04
1.cat 连接并显示 -n 显示行号 -E END 显示行尾 2.tac 从后往前显示 3.ctrl +C 4.more 向后翻 到最后会退出 5.less 翻到最后不退出 常用 支持b k sp ...
- kali linux 下搭建git服务器
参考:http://www.cnblogs.com/dee0912/p/5815267.html https://www.liaoxuefeng.com/wiki/001373951630592960 ...
- 在ASP.NET Web Forms中用System.Web.Optimization取代SquishIt
将一个ASP.NET Web Forms项目从.NET Framework 4.0升级至.NET Framework 4.5之后,发现SquishIt竟然引发了HTTP Error 500.0 - I ...
- python3之协程
1.协程的概念 协程,又称微线程,纤程.英文名Coroutine. 线程是系统级别的它们由操作系统调度,而协程则是程序级别的由程序根据需要自己调度.在一个线程中会有很多函数,我们把这些函数称为子程序, ...
- java注解优缺点
优点: 1.节省配置,减少配置文件大小 2.编译时即可查看正确与否,提高效率 缺点: 1.增加了程序的耦合性,因为注解保存在class文件中,而且比较分散 2.若要对配置进行修改需要重新编译 @aut ...
- CentOS 6.5环境实现corosync+pacemaker实现DRBD高可用
DRBD (Distributed Replicated Block Device)分布式复制块设备,它是 Linux 平台上的分散式储存系统,通常用于高可用性(high availability, ...
- Oracle12c 性能优化攻略:攻略目录表
注:本文来源于 [美] Sam Alapati , Darl Kuhn , Bill Padfield 著 朱浩波 翻译 <Oracle Database 12C 性能优化攻略> ...
- 总结Selenium WebDriver中一些鼠标和键盘事件的使用
在使用 Selenium WebDriver 做自动化测试的时候,会经常模拟鼠标和键盘的一些行为.比如使用鼠标单击.双击.右击.拖拽等动作:或者键盘输入.快捷键使用.组合键使用等模拟键盘的操作.在 W ...