nodejs node devcenter deploy javascript node.js heroku express doc

javascript - node - procfile heroku



Analizar archivos de Microsoft Office en Node.JS (4)

Estoy trabajando en una aplicación web donde los usuarios pueden cargar archivos de Microsoft Office Document. En este momento, nuestro servidor ejecuta Node.JS con Express.js y estamos alojados en Heroku. Debido a esto, no creo que pueda instalar programas como abiword o catdoc. Puedo manejar las cargas de archivos, pero no puedo analizar el contenido del documento.

¿Cómo puedo leer el contenido del archivo doc? La información se colocará en una base de datos. Sería bueno conservar el formato básico (negrita, cursiva, subrayado), pero no es esencial.




Si bien parece que no hay nada que pueda obtener con NPM que haga Word directamente, es posible que pueda usar una API REST para solicitarla a través de otro servicio en la nube. Por ejemplo, Saaspose (de las famosas herramientas Aspose) tiene API pública para Word , Excel , PDF y otros. Incluyen el soporte de node.js, javascript y Heroku en su página.

EDITAR:

Veo que Saaspose ahora se llama Aspose for Cloud.

Otra API que afirma algo similar es Doxument


Paquete de Office : npm install office parece proporcionar al menos parte de la respuesta. Lo uso para leer archivos de Excel, hasta ahora no he probado ningún documento de Word.