依赖：

<dependency>

      <groupId>org.apache.pdfbox</groupId>

      <artifactId>pdfbox-app</artifactId>

      <version>1.8.10</version>

 </dependency>

java 用PDFBox 删除 PDF文件中的某一页，前n页，后n页，效率低，不推荐使用

package com.everjiankang;

import java.io.File;

import org.apache.pdfbox.pdmodel.PDDocument;

/**运行效率很慢，因为每次删除一页就读取和保存一次文件,初始文件名格式：xxxx0.pdf*/

public class Test {

    static String  name_pre = "C:\\log\\jvm";    //文件名前缀

    static String  name_after = ".pdf";//文件名后缀

    public static void main(String[] args) {

        //1.刪除前n頁

//        cutPdfPreNPage(2);

        //2.刪除后n頁

        cutPdfAfterNPage(5);

        //3.刪除第n頁

        cutPdf(name_pre + 0 + name_after,name_pre + (0+1) + name_after,7);//删除第n页

    }

    /**

     * 删除前n页

     * @param n

     */

    public static void cutPdfPreNPage(int n) {

        for(int i = 0; i < n; i++)

            cutPdf(name_pre + i + name_after,name_pre + (i+1) + name_after,0);

    }

    /**

     * 删除后n页

     * @param n

     */

    public static void cutPdfAfterNPage(int n) {

        for(int i = 0; i < n; i++)

            cutPdf(name_pre + i + name_after,name_pre + (i+1) + name_after,1);

    }

    /**

     *

     * @param pdfPath        旧路径

     * @param newPdfPath    新路径

     * @param flag            0：第一页；1：最后一页 ；else : 要删除的页码

     */

    public static void cutPdf(String pdfPath,String newPdfPath, int flag)

    {

        File file = new File(pdfPath);

        PDDocument document = new PDDocument();

        try{

            document = PDDocument.load(file);

        }catch(Exception e){

            e.printStackTrace();

        }

        int noOfPages = document.getNumberOfPages();

        System.out.println(noOfPages);

        if(flag == 0)

            document.removePage(0);

        else if(flag == 1) {

            document.removePage(noOfPages-1);

        } else {

            document.removePage(flag-1);

        }

        try{

            document.save(newPdfPath);

            document.close();

        }catch(Exception e){

            e.printStackTrace();

        }

        System.out.println("已经转完了哦");

    }

}

抽取任意范围的PDF页作为新的PDF. 效率高

依赖

<dependency>

    <groupId>com.itextpdf</groupId>

    <artifactId>itextpdf</artifactId>

    <version>5.5.13</version>

</dependency>

代码

 /**

     * 截取pdfFile的第from页至第end页，组成一个新的文件名

     * @param pdfFile  需要分割的PDF

     * @param savepath  新PDF

     * @param from  起始页

     * @param end  结束页

     */

    public static void splitPDFFile(String respdfFile,

            String savepath, int from, int end) {

        Document document = null;

        PdfCopy copy = null;

        try {

            PdfReader reader = new PdfReader(respdfFile);

            int n = reader.getNumberOfPages();

            if(end==0){

                end = n;

            }

            ArrayList<String> savepaths = new ArrayList<String>();

            String staticpath = respdfFile.substring(0, respdfFile.lastIndexOf("\\")+1);

            //String savepath = staticpath+ newFile;

            savepaths.add(savepath);

            document = new Document(reader.getPageSize(1));

            copy = new PdfCopy(document, new FileOutputStream(savepaths.get(0)));

            document.open();

            for(int j=from; j<=end; j++) {

                document.newPage();

                PdfImportedPage page = copy.getImportedPage(reader, j);

                copy.addPage(page);

            }

            document.close();  

        } catch (IOException e) {

            e.printStackTrace();

        } catch(DocumentException e) {

            e.printStackTrace();

        }

    }

java 用PDFBox 删除 PDF文件中的某一页的更多相关文章

Java 使用PDFBox提取PDF文件中的图片
今天做PDF文件解析,遇到一个需求:提取文件中的图片并保存.使用的是流行的apache开源jar包pdfbox, 但还是遇到坑了,比如pdfbox版本太高或太低都不能用!!这个包竟然没有很好地做好兼容 ...
怎样批量删除PDF文件中的注释
日常我们在阅读一些PDF文章时候,我们会发现有些PDF文章带有非常多的注释,显得非常不美观,影响了阅读体验.那么PDF文章里的批注应该怎么进行删除呢?怎样批量删除PDF文件中的注释? 操作教程: ...
java 库 pdfbox 将 pdf 文件转换成高清图片方法
近期需要将 pdf 文件转成高清图片,使用库是 pdfbox.fontbox.可以使用 renderImageWithDPI 方法指定转换的清晰度,当然清晰度越高,转换需要的时间越长,转换出来的图片越 ...
java操作Excel、PDF文件
java操作Excel.PDF文件分享者:Vashon 分享来源:CSDN博客下面这些是在开发中用到的一些东西,有的代码贴的不是完整的,只是贴出了关于操作EXCEL的代码: jxl是一个*国人写的 ...
怎样把PDF文件中的一页提取出来
现在随着网络科技的发展在网上找资源找文件就像家常便饭一样,但是有很多文件下载完成之后只有几页是需要的这时候就很困惑了,这么多怎么才能看完啊.这样为了不浪费时间可以将有用的一页提取出来,进行使用,那怎样 ...
另类爬虫：从PDF文件中爬取表格数据
简介本文将展示一个稍微不一样点的爬虫. 以往我们的爬虫都是从网络上爬取数据,因为网页一般用HTML,CSS,JavaScript代码写成,因此,有大量成熟的技术来爬取网页中的各种数据.这次, ...
删除XML文件中的空格
应要求需要删除xml文件中的空格,制表符等字符.要求双引号和xml的text属性中包含的空格不删除. bool delSpace(QFile &file, QString path) //删除 ...
从pdf 文件中抽取特定的页面
前段时间买了一个kindle 电子书阅读器.我想用它来读的pdf文档.当然最主要是用来读python标准库&mysql的官方文档. 问题就来了.这两个都是大头书.之前用mac看还好.用kind ...
Java笔记13：统计文件中每个字符出现的次数
一.代码实现 import java.io.*; import java.util.*; /** 功能:统计文件中每个字符出现的次数思路: 1.定义字符读取(缓冲)流 2.循环读取文件里的字符,用一 ...

随机推荐

文艺平衡树 Splay 学习笔记(1)
(这里是Splay基础操作,reserve什么的会在下一篇里面讲) 好久之前就说要学Splay了,结果苟到现在才学习. 可能是最近良心发现自己实在太弱了,听数学又听不懂只好多学点不要脑子的数据结构. ...
【转】使用STM32F4的CCM内存
我们知道STM32F4当中有个CCM内存,如图所示,这个内存是挂在D总线上直接和内核相连,因此除了内核之外谁都不能访问,那么我们怎么将其利用起来呢?网上这个资料还真的很少,今天我就给大家分享一下,献给 ...
LVS搭建负载均衡（一）NAT模型
应用场景:LVS配置负载均衡方式之一:nat 测试环境: 测试步骤: 1. 在主机lvs上安装ipvsadm lvs~]# yum install ipvsadm -y lvs~]# ipvsadm ...
使用BlockQueue实现生产者和消费者模式
数据 package cn.lonecloud.procum; /** * @author lonecloud * @version v1.0 * @date 上午11:00 2018/5/7 */ ...
springAop @AfterReturning注解获取返回值
@AfterReturning(returning="rvt", pointcut="@annotation(com.sinosoft.redis.cache.PutCa ...
如何在Windows 10上运行Docker和Kubernetes？
如何在Windows 10上运行Docker和Kubernetes? 在Windows上学习Docker和Kubernetes,开始的时候会让你觉得无从下手.最起码安装好这些软件都不是一件容易的事情. ...
ava EE 7 - Injection into Runnable/Callable object ejb entityManager Concurrency ManagedExecutorService 异步调用如何获取context
或者直接把 MyTask类内嵌如MyBean中,这样可以在myBean中inject 数据库连接,在内嵌类内访问. java ee 引入了并发执行.因为是在服务器执行并发,所以要用java ee包里面 ...
js 函数声明和函数表达式的区别
javascript中声明函数的方法有两种:函数声明和函数表达式. 区别如下: 1).以函数声明的方法定义的函数,函数名是必须的,而函数表达式的函数名是可选的. 2).以函数声明的方法定义的函数,函数 ...
RedHat下安装MySQL5.5
MYSQL在windows下面安装可能一帆风顺,但是如果真的到纯图形界面的redhat服务器上,可能就不是那么容易了, 这里我就详细的介绍一下MYSQL5.5在linux下的安装以及注意的问题,避免后 ...
windows环境下安装python2和python3
一. python 安装 1. 下载安装包 https://www.python.org/ftp/python/2.7.14/python-2.7.14.amd64.msi # 2.7安装包 htt ...

java 用PDFBox 删除 PDF文件中的某一页

java 用PDFBox 删除 PDF文件中的某一页，前n页，后n页，效率低，不推荐使用

java 用PDFBox 删除 PDF文件中的某一页的更多相关文章

随机推荐

热门专题