uPDF-功能强大的PDF文件处理小工具
前几天因为工作原因,需要将一个PDF压缩一下。
网上找了半天,要么收费,要么就是转换的质量不太好。
论坛也找到一些破解的软件,但是总有点不太合适,有些功能还挺复杂。
也有些在线转换的,又考虑到自己较为隐私的pdf文件不想上传,不得已只能放弃。
索性自己写了个小工具,使用了网上的一些PDF类库,感谢提供类库的各位大神了。主要功能:
.PDF压缩
.PDF转word/excel/ppt/图片
.PDF文件中图片提取
.PDF文件合并/拆分
.OCR文字识别
.PDF文件去水印
.图片转PDF
.PDF去保护
关于使用:
1、去水印功能:去水印有默认模式和手动模式两种,一些图片水印或文字水印,本身含有“水印的标签”,此类水印可使用默认模式去除,某些水印图片或水印文字是通过非常规方法加入到PDF中的,本身不含有“水印标签”,对于此类水印,只能使用手动模式自行分析后去除。另外,有些PDF文件在同一位置加了多层水印,手动模式一次去除不干净,需要多次手动去除。同时有些水印加的比较“特别”,无法一步到位全去除,可以通过组合方式,例如先用模式1,再用模式2等,多步完成,这样做是为了将不同逻辑单独拆分,并通过多种组合的方式来使用更复杂情况的水印。2、OCR功能:在2.1及以后版本中重新设计了OCR功能,包括在线和离线两种方式,在线OCR使用了百度的接口,每日有5万次免费调用,超出后请第二天使用,后续考虑加入自定义key的功能,可用自己的key。离线OCR适合重要\保密PDF的文字识别,或无网络情况下的文字识别,请在下方的网盘中下载相关语言资源包,并按下图放置。未按此方式放置的,无法使用。
3、内存不足:在使用去水印功能或PDF压缩功能时,由于需要大量计算、分析,因此内存占用较高,而32位版应用在64位系统下运行时,默认最大可以使用2GB内存。因此即便系统内存有闲置,软件也无法调用到,容易出现“明明系统很多内存,为什么还报内存不足”。因此推出64位版本解决该问题。
关于程序:
1、关于报毒:程序做了加密和打包,绿色单文件,无需安装,方便携带,无毒,火绒测试通过,报毒的自行判断。
2、关于软件无法启动:多属于系统环境问题,需.NET 4.6以上环境支持,win7 和 win10 都测试通过,如果启动不了,可能是系统缺少运行库,可按提示自行解决。
3、软件免费使用,没有任何水印、页数限制或试用期限制,严禁倒卖,或者反编译后加入收费功能。
4、除在线更新功能以外,所有功能均可断网使用,包括OCR识别(在线OCR是提交至百度),因此软件在最大限度上保证了使用安全。
自2019年12月30日发布以来,得到了很多网友的喜欢,也看到很多网站提供了该软件的下载。
同时也真的没想到,不知不觉就走过了7个多月。
这7个多月里我一直坚持更新,作为一款免费软件来讲,应该还算是尽心尽力了。
期间自己提升了编程水平,也收获了不少朋友。
得到过鼓励,得到过认可,也遭受过非议。
但不论怎样,还有这么多喜欢该软件的网友,那也是我坚持更新下去的动力。
所以,让我们一起来看看,这个软件到底能更新多久,未来他到底会变成什么样子。
最后,强烈建议大家试试我的去水印。另外:为了实现自动更新,我自掏腰包购买了服务器,但毕竟个人能力有限,所以带宽不高,自动更新速度不快,结果回帖里就有人骂我“恶心”,花钱挨骂的事果然不少见。
同时也有网友反应为什么要强制更新,这是因为现在几个版本有些调整是必须的,比如严重bug,比如为了将来更好的自动更新。
因此,从2.2版开始,调整了文件存放服务器,下载速度更快,同时支持用户调用自己的下载器(IDM、迅雷等),我实测IDM下载更新速度1m/s。
另外,2.2版本开始,每次更新我也会单独传网盘。
12月30日更新 1.0版本:
修复了部分网友反馈的显示不正常的问题1月2日更新 1.1版本:
增加了PDF拆分功能1月3日更新 1.1.1版本:
修复了拆分功能里,选择每页拆分时必须要填写起始结束页的问题。1月7日更新 1.2版本:
加入了OCR识别,对于扫描件的PDF进行文字提取。本次OCR使用非网络接口,即断网状态依然可使用。
考虑到文件大小,仅加入了中文简体、中文繁体及英文字体的识别,即便这样,文件也达到了158M。
不需要OCR识别功能的可不使用此版本。
PS:此版本仅上传至百度网盘,因为蓝奏云有100M大小限制,我传不上去。1月9日更新 1.3 版本:
本次更新加入去水印功能,可一次性直接去除文字和图片水印。有些所谓的“水印”其实是扫描件里和扫描图相融为一体的,可以理解为水印图层和图像图层合二为一,这种就没办法去除了。
考虑到文件大小,依然发布两个版本,含OCR和不含OCR,可自行选择下载。
ps:ocr版本依然只上传了百度云。1月16日更新 1.4版本:
本次更新加入pdf文件合并功能,并修复了PDF文件图片提取、PDF转图片功能中,因为图片文件名重名可能导致的文件覆盖问题。3月6日更新 1.5版本:
本次更新修复了PDF文件合并功能中输出文件名因同名导致的错误。3月9日更新 1.6版本:
本次更新 新增了图片转换PDF功能,支持多图片文件合并转换PDF,也支持单图片文件转换PDF。3月27日更新 1.7.1版本:
本次更新,优化了去水印功能,可手动分析文字及图片水印并去除。4月3日更新 1.7.2版本:
本次更新,优化了去除图片水印功能,增加了水印扫描模式,更智能的识别水印图片。4月8日更新 1.7.3版本:
本次更新,优化了去文字水印功能,增加文字扫描模式,更智能的识别文字水印。4月10日更新 1.7.5版本:
不要问为什么没有1.7.4,因为这个版本我没发布,只做了内测。本次更新优化了文字去水印功能,去除部分超链接。
整体上去水印功能就告一段落了。水印的形式各种各样,无法做到一个程序解决市面上所有的水印,只能尽可能的覆盖各种情况。
希望能成为市面上最好用的小工具。4月13日更新 1.8版本:
新增权限解密功能,恢复PDF文件复制、编辑、打印等权限,并非破解PDF文件打开密码。4月22日更新 1.8.1版本:
文件合并、图片转PDF中,增加文件多选功能,方便多文件添加。4月23日更新 1.8.3版本:
优化超大文件去水印时报错及速度,363M文件去水印时,原先耗时10分钟,现在耗时十几秒。6月3日更新 1.8.5版本:
坛友说要有拖拽功能,于是就有了拖拽功能 。6月4日更新 1.8.7版本:
修复去水印功能按钮丢失bug 。6月5日更新 1.8.8版本:
修复去水印功能中的一处bug,修改批量添加文件时按名称排序。6月10日更新 1.8.9版本:
修复去水印功能中的一处bug。6月11日更新 1.9.0版本:
1、修复pdf压缩功能失效的问题;
2、重构大量代码,精简大量资源文件,大幅缩小文件体积;3、继续优化去水印功能。7月2日更新 2.0版本:
1、优化PDF文件压缩功能;
2、加入自动更新功能;7月8日更新 2.1版本:
1、优化图片转PDF功能,解决图片被拉伸问题;
2、加入OCR识别功能,可使用在线(每日5万次调用额度)及离线方式识别PDF文字,使用离线OCR功能时需下载语言资源文件至指定目录,详细放置方式见上方“关于使用”;7月9日更新 2.1.1版本:
1、编译32位和64位两个版本,64位版本可充分利用系统可用内存,在使用去水印及PDF压缩时不再出现内存不足问题;
2、继续优化图片转PDF功能;7月11日更新 2.2版本:
1、优化文字水印扫描,增加模式4,更加智能;
2、调整文件服务器,自动更新可调用用户下载工具(IDM、迅雷等),下载速度更快(实测1m/s以上)--从2.2版本开始;
下载地址:
百度云: https://pan.baidu.com/s/1996UoB8h-MIBmRj6p8HJ6g 提取码: 9h64
蓝奏云:https://howze.lanzous.com/b00to0k1a 密码:93xq
uPDF-功能强大的PDF文件处理小工具的更多相关文章
- 强大的pdf文件操作小工具——PDFtk的小白用法 【转载】
转载出处https://www.cnblogs.com/basterdaidai/p/6204518.html 前言 作为程序员,大家都知道的,总是会被技术小白问各种跟编程没什么关系的硬件.软件问题. ...
- 功能强大的PDF实用工具
PDF实用工具(PDFTool)是北京博信施科技有限有限公司研制开发的一款专门提供对PDF文件进行编辑.加工的处理软件.本软件具有对PDF文件进行分割.结合.加密.解密.添加水印.设定有效期限等多种功 ...
- 在windows下实时监控、接受文件变化小工具
在windows下实时监控文件变化小工具 在测试的时候,我们可能想实时监控系统打出的log信息,在unix系统上我们可以用"tail -f"实现,在windows下一般就无法做 ...
- 用C#Winform写个简单的批量清空文件内容和删除文件的小工具
用C#Winform写个简单的批量清空文件内容和删除文件的小工具 本文介绍这个简单得不能再简单的小项目.做这个项目,有以下目的. 1 当然是做个能用的工具 2 学习使用Github 关于用VS2013 ...
- 讲解开源项目:功能强大的 JS 文件上传库
本文作者:HelloGitHub-kalifun HelloGitHub 的<讲解开源项目>系列,项目地址:https://github.com/HelloGitHub-Team/Arti ...
- PDF文件比对工具
tex/PDF对比工具讨论:https://tex.stackexchange.com/questions/65453/track-changes-in-latex 如果有源文件,直接用latexpa ...
- 开源一个自动整理B站UWP客户端软件进行批量下载的视频文件的小工具BiliVideosReoganizeHelper
大家都知道B站是一个很受欢迎的视频学习网站,上面有很多无私的up主上传了大量优秀的教学视频,在此向B站致敬,向广大UP主致敬. 有时,我们需要下载收藏一些视频,以防止以后找不到了.那么我们可以用B ...
- pdf转换为word小工具,挺好
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvZGFwZW5nMDExMg==/font/5a6L5L2T/fontsize/400/fill/I0JBQk ...
- 测试修改hosts文件py小工具
import sys,osparm_list=sys.argvHOST_PATH=r'C:\liuliang\flask_test\test\hosts'class HostFile(object): ...
随机推荐
- conda 管理包
查看当前环境已经安装的包 conda list 查看指定环境中的安装包 conda list -n python27 在Anaconda 库中搜索包 conda search numpy #模糊搜索 ...
- 如何 SSH 到 Linux 服务器里的特定目录及执行命令?
你是不是有遇到过这样的场景?使用 SSH 命令进入到服务器,然后再用 cd 命令进入到对应目录,再继续进行你的工作. 这种操作对于新手来讲特别常见,良许之前也是这样.在本文,老司机将带你来进行更高效的 ...
- WeChair项目Alpha冲刺(8/10)
团队项目进行情况 1.昨日进展 Alpha冲刺第八天 昨日进展: 前端:安排页面美化,设计实名认证 后端:用户信息通过dao层存储数据库 数据库:修改数据表属性,与后端部署数据库交互 2.今日安 ...
- 计算机网络之tcp四次挥手
TCP的四次挥手(Four-Way Wavehand)1.前言对于"三次握手"我们耳熟能详,因为其相对的简单.但是,我们却不常听见“四次挥手”,就算听过也未必能详细地说明白它的具体 ...
- msf stagers开发不完全指北(一)
采用c开发stagers 前言 之前有写过一篇 metasploit payload运行原理浅析(sockedi调用约定是什么),里面有提到以后了解这些东西后可以做的事情,其实包括但不限于自写stag ...
- caffe的python接口学习(2)生成solver文件
caffe在训练的时候,需要一些参数设置,我们一般将这些参数设置在一个叫solver.prototxt的文件里面 有一些参数需要计算的,也不是乱设置. 假设我们有50000个训练样本,batch_si ...
- windows下 react-native环境搭建
跟着慕课网做案例,搭建rn环境遇到很大问题. 下面说一下: 首先看一下文档:http://reactnative.cn/docs/0.44/getting-started.html#content 注 ...
- MongoDB快速入门教程 (2)
2.MongoDB的基本的CRUD操作 2.1.创建文档 在具体操作之前,想要知道有多少数据库,可以执行下面命令 show dbs 在mongodb中,数据库中包含的叫做集合(表),集合中存储的内容叫 ...
- .NET Core下开源任务调度框架Hangfire
今天无意中发现了一个很好用的任务调度框架.Hangfire作为一款高人气且容易上手的分布式后台执行服务,支持多种数据库.在 .net core的环境中,由Core自带的DI管理着生命周期. 相较于qu ...
- Glusterfs的安装、创建卷、配置和优化卷、挂载使用
一.网站推荐 1.https://gluster.readthedocs.io/en/latest/ 这是官方的说明网站.这里面有安装Glusterfs原理,安装流程,各种卷的原理.创建方式.以 ...