PDFBox - Eliminación de páginas

Aprendamos ahora a eliminar páginas de un documento PDF.

Eliminar páginas de un documento existente

Puede eliminar una página de un documento PDF existente utilizando el removePage() método del PDDocument clase.

Paso 1: carga de un documento PDF existente

Cargue un documento PDF existente utilizando el método estático load() del PDDocumentclase. Este método acepta un objeto de archivo como parámetro, ya que este es un método estático, puede invocarlo usando el nombre de la clase como se muestra a continuación.

File file = new File("path of the document") 
PDDocument.load(file);

Paso 2: enumerar el número de páginas

Puede enumerar el número de páginas que existe en el documento PDF utilizando el getNumberOfPages() método como se muestra a continuación.

int noOfPages= document.getNumberOfPages();
System.out.print(noOfPages);

Paso 3: eliminar la página

Puede eliminar una página del documento PDF utilizando el removePage() método del PDDocumentclase. Para este método, debe pasar el índice de la página que se va a eliminar.

Al especificar el índice de las páginas en un documento PDF, tenga en cuenta que la indexación de estas páginas comienza desde cero, es decir, si desea eliminar la primera página, el valor del índice debe ser 0.

document.removePage(2);

Paso 4: guardar el documento

Después de eliminar la página, guarde el documento PDF con el save() método del PDDocument class como se muestra en el siguiente bloque de código.

document.save("Path");

Paso 5: cerrar el documento

Finalmente, cierre el documento usando el close() método del PDDocument clase como se muestra a continuación.

document.close();

Ejemplo

Supongamos que tenemos un documento PDF con nombre sample.pdf y contiene tres páginas vacías como se muestra a continuación.

Este ejemplo demuestra cómo eliminar páginas de un documento PDF existente. Aquí, cargaremos el documento PDF especificado anteriormente llamadosample.pdf, elimine una página y guárdela en la ruta C:/PdfBox_Examples/. Guarde este código en un archivo con nombreRemoving_pages.java.

import java.io.File;
import java.io.IOException;

import org.apache.pdfbox.pdmodel.PDDocument;

public class RemovingPages {

   public static void main(String args[]) throws IOException {

      //Loading an existing document
      File file = new File("C:/PdfBox_Examples/sample.pdf");
      PDDocument document = PDDocument.load(file);
       
      //Listing the number of existing pages
      int noOfPages= document.getNumberOfPages();
      System.out.print(noOfPages);
       
      //Removing the pages
      document.removePage(2);
      
      System.out.println("page removed");

      //Saving the document
      document.save("C:/PdfBox_Examples/sample.pdf");

      //Closing the document
      document.close();

   }
}

Compile y ejecute el archivo Java guardado desde el símbolo del sistema utilizando los siguientes comandos.

javac RemovingPages.java 
java RemovingPages

Tras la ejecución, el programa anterior crea un documento PDF con páginas en blanco que muestran el siguiente mensaje.

3
page removed

Si verifica la ruta especificada, puede encontrar que la página requerida se eliminó y solo quedaron dos páginas en el documento, como se muestra a continuación.