simple pure limpiador doc2html cleaner clean html ms-word

pure - ¿La mejor forma de exportar html a Word sin tener instalado MS Word?



word to basic html (11)

¿Hay alguna manera de exportar una página html simple a Word (formato .doc, no .docx) sin tener instalado Microsoft Word?



Creo que Open Office puede abrir archivos .html y crear archivos .doc


Si bien es posible crear un archivo ".doc" de Microsoft Word, probablemente sería más fácil y portátil crear un archivo ".rtf".


Si solo se trata de HTML, todo lo que necesita hacer es cambiar la extensión a .doc y Word la abrirá como si fuera un documento de Word. Sin embargo, si hay imágenes para incluir o javascript para ejecutar, puede ser un poco más complicado.


Si solo tiene páginas HTML simples como dijo, se puede abrir con Word.

De lo contrario, hay algunas bibliotecas que pueden hacer esto, pero no tengo experiencia con ellos.

Mi última idea es que si está utilizando ASP.NET, intente agregar application/msword al encabezado y puede guardarlo como un documento de Word (no será un documento de Word real, solo un HTML renombrado como doc para ser capaz de abrir).



Hay una herramienta llamada JODConverter que se conecta a la oficina abierta para exponer sus convertidores de formato de archivo, hay versiones disponibles como una aplicación web (se encuentra en Tomcat) en la que se publica y una herramienta de línea de comandos. He estado lanzando html y convirtiéndolo a .doc y pdf con éxito, está en un proyecto bastante grande, todavía no se ha publicado, pero creo que lo voy a usar. http://sourceforge.net/projects/jodconverter/


Existe un proyecto de código abierto llamado HTMLtoWord que permite a los usuarios insertar fragmentos de HTML bien formado (XHTML) en un documento de Word como texto formateado.

Documentación HTMLtoWord


Si está trabajando en Java, puede convertir HTML a contenido docx real con el código que publiqué en docx4j 2.8.0 . Digo "real", porque la alternativa es crear un AltChunk HTML, que se basa en Word para hacer la conversión real (cuando el documento se abre por primera vez).

Vea las diversas muestras con el prefijo ConvertInXHTML . El proceso de importación espera un XML bien formado, por lo que es posible que tenga que ordenarlo primero.


Puede abrir archivos html con Libreoffice Writer. Luego puede exportar como PDF desde el menú Archivo. También los navegadores pueden exportar html como un archivo PDF.