PDFBox es una librería java open source que nos va a permitir realizar una gestión avanzada sobre ficheros pdfs. Se distribuye bajo la licencia Apache License v2.0.
Entre las funciones que ofrece esta librería podemos encontrar:
· Extraer texto de un pdf
· Mezclar varios documentos pdfs en uno
· Dividir en páginas un documento pdf
· Gestionar los formularios de un documento pdf
· Validar un documento pdf contra el estándar PDF/A ISO
· Dado un pdf generar un fichero que puede ser gestionado por el API de impresión de Java.
· Convertir un pdf a una imagen
· Crear un documento pdf a partir de un texto
· Cifrar/descifrar documentos pdf
Para poder empezar a usar PDFBox basta con añadir la siguiente dependencia a nuestro proyecto
En el caso de que queramos hacer uso de las opciones para cifrar y descrifrar, tendremos que añadir adicionalmente
El uso de la librería es muy sencilla a parte de estar bien documentado y de ser sencillo encontrar ejemplos de cómo hacer las operaciones más frecuentes. Para ilustrar la facilidad de uso, veamos el siguiente ejemplo en el que dado un PDF se descompone por paginas, generando un documento por cada página del documento original
En el mercado existen también otras alternativas para realizar una gestión avanzada de pdfs:
· jPDFProcess: se trata de una librería bastante potente y fácil de usar, pero es de pago
· PDFClown: se trata de una librería open source como PDFBox, pero que carece de algunas de las funciones como por ejemplo la posibilidad de cifrar/descifrar documentos
· iText: se trata de una librería bastante potente que tiene una versión comercial y una versión distribuida bajo licencia AGPL.Ofrece funciones de muy bajo nivel lo cual puede ser bueno ya que da mucho control, pero también tiene su aspecto negativo en que su uso puede ser complicado.





Replica a daniel Cancelar la respuesta