javascript - node - procfile heroku
Analizar archivos de Microsoft Office en Node.JS (4)
Estoy trabajando en una aplicación web donde los usuarios pueden cargar archivos de Microsoft Office Document. En este momento, nuestro servidor ejecuta Node.JS con Express.js y estamos alojados en Heroku. Debido a esto, no creo que pueda instalar programas como abiword o catdoc. Puedo manejar las cargas de archivos, pero no puedo analizar el contenido del documento.
¿Cómo puedo leer el contenido del archivo doc? La información se colocará en una base de datos. Sería bueno conservar el formato básico (negrita, cursiva, subrayado), pero no es esencial.
Parece que todavía no hay ninguno. Vea a continuación algo que podría ayudar.
Puede usar mammoth para analizar archivos .docx https://www.npmjs.com/package/mammoth y xlsx para analizar archivos .xlsx https://github.com/SheetJS/js-xlsx
Si bien parece que no hay nada que pueda obtener con NPM que haga Word directamente, es posible que pueda usar una API REST para solicitarla a través de otro servicio en la nube. Por ejemplo, Saaspose (de las famosas herramientas Aspose) tiene API pública para Word , Excel , PDF y otros. Incluyen el soporte de node.js, javascript y Heroku en su página.
EDITAR:
Veo que Saaspose ahora se llama Aspose for Cloud.
Otra API que afirma algo similar es Doxument
Paquete de Office : npm install office
parece proporcionar al menos parte de la respuesta. Lo uso para leer archivos de Excel, hasta ahora no he probado ningún documento de Word.