Apache POI Word - Descripción general

Muchas veces, se requiere una aplicación de software para generar documentos de referencia en formato de archivo de Microsoft Word. A veces, incluso se espera que una aplicación reciba archivos de Word como datos de entrada.

Cualquier programador de Java que desee producir archivos de MS-Office como salida debe usar una API predefinida y de solo lectura para hacerlo.

¿Qué es Apache POI?

Apache POI es una API popular que permite a los programadores crear, modificar y mostrar archivos de MS-Office utilizando programas Java. Es una biblioteca de código abierto desarrollada y distribuida por Apache Software Foundation para diseñar o modificar archivos de MS-Office usando el programa Java. Contiene clases y métodos para decodificar los datos de entrada del usuario o un archivo en documentos de MS-Office.

Componentes de Apache POI

Apache POI contiene clases y métodos para trabajar en todos los documentos compuestos OLE2 de MS-Office. La lista de componentes de esta API se proporciona a continuación:

  • POIFS (Poor Obfuscation Implementation File System)- Este componente es el factor básico de todos los demás elementos de POI. Se utiliza para leer distintos archivos de forma explícita.

  • HSSF (Horrible SpreadSheet Format) - Se utiliza para leer y escribir en formato .xls de archivos MS-Excel.

  • XSSF (XML SpreadSheet Format) - Se utiliza para el formato de archivo .xlsx de MS-Excel.

  • HPSF (Horrible Property Set Format) - Se utiliza para extraer conjuntos de propiedades de los archivos de MS-Office.

  • HWPF (Horrible Word Processor Format) - Se utiliza para leer y escribir archivos de extensión .doc de MS-Word.

  • XWPF (XML Word Processor Format) - Se usa para leer y escribir .docx archivos de extensión de MS-Word.

  • HSLF (Horrible Slide Layout Format) - Se utiliza para leer, crear y editar presentaciones de PowerPoint.

  • HDGF (Horrible DiaGram Format) - Contiene clases y métodos para archivos binarios de MS-Visio.

  • HPBF (Horrible PuBlisher Format) - Se utiliza para leer y escribir archivos de MS-Publisher.

Este tutorial lo guía a través del proceso de trabajo en archivos de MS-Word usando Java. Por lo tanto, la discusión se limita a los componentes HWPF y XWPF.

Note- VERSIONES ANTIGUAS DE FORMATOS DE ARCHIVOS BINARIOS DE APOYO DE POI, COMO DOC, XLS, PPT, ETC. VERSIÓN 3.5 EN ADELANTE, POI SOPORTA FORMATOS DE ARCHIVO OOXML DE MS-OFFICE COMO DOCX, XLSX, PPTX, ETC.