对扫描的pdf文件生成目录
很多pdf文件是直接扫描生成的,于是它的内容都是一张张的图片,当然就更没有目录索引了。
有的时候想找某些内容,只能一点点的移动滚动条,非常不方便。
那么有什么方法能生成目录呢?
方法一:使用福昕pdf编辑器
福昕pdf编辑器使用PRC识别pdf文件,能将pdf文件转换为office文件,更是有目录制作的功能。
但是,亲测后发现:
- 也是最关键的问题,他需要money,也就是得升级为会员,才能使用图片识别功能。
- 目录制作倒是免费的,但它的目录主要是设置标签,对于目录没有分级功能,且需要一页一页翻的去添加,非常麻烦
总之,最后的制作非常不理想。
方法二:使用FreePic2Pdf
先看一下最终效果图:
我使用的是《同济大学高等数学第六版上册.pdf》,打开pdf的软件是2345看图王,也可以用chrome打开。
怎么样,效果是不是非常良好。
FreePic2Pdf这是一个图片转pdf文件,但主要使用的是它的更改pdf的功能。
至于下载地址就不提供了(因为没找到它的官网),网上一搜一堆,第三方下载地址很多的。
软件打开是这样子的:
这些功能都不需要,主要使用的是右下角的更改pdf,点开之后:
主要使用的就是这一部分的功能。
现在开始目录制作。
先解释一下上述标签的意思:
- 往PDF挂书签:就是为pdf文件添加目录。不过需要目录文件,下面会有介绍制作的方式。
- 从PDF取书签:就是从有目录的pdf文件中提取出目录文件。
- 需要操作的目录文件:就是需要添加目录的PDF文件。
- 存放接口的文件夹:就是目录文件,需要制作。
其他的按键一般没什么需要使用的。
制作目录需要一个目录文件,使用的是txt格式。
一、选择一个存放接口的文件夹
这个文件夹可以自己创建。
二,创建配置文件
选定文件夹之后,再点击创建文件夹右边的那个按钮,输入以下模板内容:
[Images] [Font]
Language=GBK
FontSize=
Margin=0.5 [Bkmk]
File=FreePic2Pdf_bkmk.txt
AddAsText=
ShowBkmk=
ShowAll=
BasePage= [Main]
ContentsPage=
TextPage=
保存。之后他就会在选定的文件夹下创建一个名为 FreePic2Pdf.itf 的文件。
三、创建目录文件
在这个文件夹下新建一个 FreePic2Pdf_bkmk.txt 文件。
这个文件就是目录文件,这里的目录需要自定义,它需要按照一定的格式:
一级目录\t页码
\t二级目录\t页码
\t\t三级目录\t页码
。。。
\t表示制表符,也就是TAB键。
例如:
这个文件可以用记事本写,也可以用notepad等等。
那么这些内容具体怎么去写呢?
这个就得看自己的电脑技能了。不过总的来说是以下几步:
1、识别目录文字
- 可以使用ABBYY软件识别,但是不建议,具体原因请自行入坑。
- 推荐的:使用网页百度翻译。没错,就是百度翻译,将目录图片粘贴上去,他就自动识别并将中文和英文翻译显示出来了。
至于目录的图片,你可以截图,也可以使用2345看图王软件,如下图:
直接就复制目录了,这样复制的目录完整一点。
2、目录制作
百度翻译的识别效果如下:
呃,没有换行,内容也有部分缺失,这些都是需要自己去修改。
那么如何将这些内容制作成需要的格式呢,这个。。。要么靠自己手动编辑,如果会正则表达式,可以节省一点时间。
注意:目录的页码是pdf文件的真实页码,而不是书上标志的那些页码,为了方便,可以将接口文件中 BasePage 字段修改为书中第一页对应的pdf页数。
如:BasePage=12
制作成功后,选择相应的文件,如下图:
再点击开始,没问题的话瞬间制作完成。制作前记得先保存副本。
接着再点开pdf文件,就会发现目录有了:
到此,制作完成!!!
对扫描的pdf文件生成目录的更多相关文章
- C#/VB.NET 在Word转PDF时生成目录书签
当我们在转换Word文档到PDF格式时,想保留Word文档的标题作为PDF书签,那么应该如何操作呢?那么本文将以C#及VB.NET代码为例,介绍如何在Word转PDF时生成目录书签.下面是具体方法和步 ...
- 为Markdown文件生成目录
缘由 思路 效果 代码实现 缘由 Markdown源生文件源生不支持目录,目前比较主流的生成目录的方式(各式插件),都是转化为HTML文件.虽然HTML文件可以生成眼花缭乱的目录,但是修改起来又没有M ...
- 为 github markdown 文件生成目录(toc)
业务需要 在编写 github 项目时,有时候会编写各种 README.md 等 markdown 文件,但是 github 默认是没有目录的. 于是就自己写了一个小工具. markdown-toc ...
- ios开发之--PDF文件生成
写项目的时候,碰到一个需求,就是在手机端根据指定的文件内容生成PDF文件,并可以保存到手机上,因为以前只是听说过,没有真正的去了解过这个需求,通过查阅资料,可以实现这个功能,话不多说,代码如下: -( ...
- GitHub README文件生成目录导航
效果 环境说明 [root@C61 ~]# cat /etc/redhat-release CentOS release 6.10 (Final) [root@C61 ~]# uname -a Lin ...
- QT生成PDF文件
QString temp=""; //m_File_Content_Text_Edit->selectAll(); QString t_File_Content = m_Fi ...
- Pdf File Writer 中文应用(PDF文件编写器C#类库)
该文由小居工作室(QQ:2482052910) 翻译并提供解答支持,原文地址:Pdf File Writer 中文应用(PDF文件编写器C#类库):http://www.cnblogs.com/ ...
- C# Parsing 类实现的 PDF 文件分析器
下载示例 下载源代码 1. 介绍 这个项目让你可以去读取并解析一个PDF文件,并将其内部结构展示出来. PDF文件的格式标准文档可以从Adobe那儿获取到. 这个项目基于“PDF指南,第六版,Adob ...
- .NET平台开源项目速览(16)C#写PDF文件类库PDF File Writer介绍
1年前,我在文章:这些.NET开源项目你知道吗?.NET平台开源文档与报表处理组件集合(三)中(第9个项目),给大家推荐了一个开源免费的PDF读写组件 PDFSharp,PDFSharp我2年前就看过 ...
随机推荐
- 12章 搜索框架ElasticSearch介绍和整合SpringBoot 4节课
1.搜索引擎知识和搜索框架elasticsearch基本介绍 简介:通过京东电商 介绍什么是搜索引擎,和开源搜索框架ElasticSearch6.x新特性介绍 前言:介绍ES的主要特点和使用场 ...
- 搭建Modelsim SE仿真环境-使用do文件仿真
本章我们介绍仿真环境搭建是基于Modelsim SE的.Modelsim有很多版本,比如说Modelsim-Altera,但是笔者还是建议大家使用Modelsim-SE,Modelsim-Altera ...
- WGAN源码解读
WassersteinGAN源码 作者的代码包括两部分:models包下包含dcgan.py和mlp.py, 这两个py文件是两种不同的网络结构,在dcgan.py中判别器和生成器都含有卷积网络,而m ...
- SSH原理与运用:远程登录
一.什么是SSH? 简单说,SSH是一种网络协议,用于计算机之间的加密登录. 如果一个用户从本地计算机,使用SSH协议登录另一台远程计算机,我们就可以认为,这种登录是安全的,即使被中途截获,密码也不会 ...
- mysql中文乱码或提示error
插入一条中文记录: 语句: insert into employee(id,name,job,salary) values(4,'小明','清洁员',1500); 提示: ERROR 1366 (HY ...
- python闭包的理解说明
什么是闭包: 闭包(closure)是函数式编程的重要的语法结构.函数式编程是一种编程范式 (而面向过程编程和面向对象编程也都是编程范式).在面向过程编程中,我们见到过函数(function):在面向 ...
- zabbix通过简单shell命令监控elasticsearch集群状态
简单命令监控elasticsearch集群状态 原理: 使用curl命令模拟访问任意一个es节点可以反馈的集群状态,集群的状态需要为green curl -sXGET http://serverip: ...
- mysql删除数据库文件ibdata1后引发的故障
进行性能测试是发现大量报错: Duplicate entry主键重复 可以看到mysql数据库中已经没有innodb引擎启动信息了 之前发现ibdata1占用了大量硬盘,为了省出空间删除了数据库ibd ...
- Ex 6_26 序列对齐..._第七次作业
- Ex 6_16 旧货销售问题_第七次作业
即可 子问题定义:定义数组B(S,j),其中 B(S,j)表示在子集S中结束位置为j的子问题的最大收益值,其中j的前一个地点有两种情况,第一种情况是某个拍卖会 另一种情况是从家里出发. 递归关系: 初 ...