tag - Convertir pdf, doc, ppt a html5
html download link (6)
Busqué en Google (sin suerte) open source software that can convert doc, ppt, and pdf to HTML5.
(Exactamente lo que hace Scribd ) ¿Existen equivalentes de fuente abierta para el tipo de conversión que hace Scribd?
Si alguien sabe de un servicio pagado, eso también funcionaría. Scribd tiene una API , pero eso es para usar con el visor de flash. Además, me gustaría alojar mi propio contenido ya que necesito más control sobre el documento html convertido .
Es poco probable que encuentre una sola oferta que haga todo esto, especialmente en el mundo de código abierto. Es más probable que termine confiando en una mezcolanza de cosas, e incluso puede necesitar encadenar algunos convertidores para llegar a HTML. (Por ejemplo, PDF -> ps -> HTML)
OpenOffice admite la conversión a HTML, y se puede llamar desde la línea de comandos.
http://pdftohtml.sourceforge.net/ parece bastante bueno para convertir pdf a html.
Para Doc que es formato Word ML o OpenXML, es concebible que pueda usar transformaciones XSLT ya que ambos formatos de entrada y salida son XML. He visto algunas hojas de estilo flotando alrededor de la red que hacen esto, pero YMMV.
Por cierto, ¿por qué hay un requisito específico para el código abierto? MS Powerpoint ya admite guardar como HTML, por ejemplo.
Open Office convertirá el pdf a html pero tendrá un impacto en la calidad del diseño.
Sugiero cualquiera: Crocodoc como servicio pago (proporciona diferentes sabores para diferentes plataformas como Python, Ruby, Java, los desarrolladores de PHP pueden trabajar en sus API) o esperando una herramienta oficial de Adobe (está en proceso).
Para la conversión de PDF a HTML, pdf2htmlEX parece una herramienta bastante buena (mirando todos los ejemplos / muestras):
Para pdf hay un proyecto de código abierto iniciado por mozilla y es muy bueno: https://github.com/mozilla/pdf.js/
Puedes ver un ejemplo de Hello World: https://github.com/mozilla/pdf.js/tree/master/examples/helloworld
Para el resto de los tipos de documento, creo que LibreOffice dijo que están planeando construir algo en html5, pero hasta ahora no se ha hecho nada.
Sé que la pregunta es un poco antigua, sin embargo, he encontrado una nueva herramienta de código abierto llamada Flaxpaper http://flexpaper.devaldi.com/
http://wvware.sourceforge.net/
wvHtml: convierta su documento de Word en HTML4.0.
Posiblemente: http://www.abisource.com/ pero en este caso se ve como "abrir documento"> "exportar html" manualmente, tal vez los complementos ayuden. No estoy seguro, ¿qué quiere decir con "software fuente que puede convertir".
O esto: http://www.zope.org/Members/sf/NuxDocument
También el pdftohtml le dará una salida de página html. Pero tendrá que trabajar en su interfaz gráfica. Ya que no parece ser muy interactivo.