php - online - pdf to html python
Convertir PDF a HTML (4)
¿Ha considerado guardar los datos PDF en una base de datos y luego crear dinámicamente el PDF o la página html en función de lo que seleccionen los visitantes?
¿Cuál es la mejor solución para convertir documentos PDF para que se vean en el navegador como HTML? El sitio tiene varios documentos PDF y el visitante puede hacer clic en ver como HTML y esto debe verse en la pantalla como un archivo HTML.
Sitio web estándar que ejecuta PHP, Linux, Apache.
Si está preparado para llamar a Java desde PHP, puede consultar http://www.jpedal.org/html_index.php
Si tiene acceso a la línea de comandos en su proveedor de alojamiento, hay una utilidad llamada pdftohtml dentro del paquete poppler_utils.
http://poppler.freedesktop.org/
Parece bastante fácil de usar, no lo ha llamado desde dentro de PHP, pero debería funcionar.
pdftohtml funciona bien: rápido, estable pero el resultado html es feo en el mejor de los casos. Lo he usado durante bastante tiempo para un sitio web que tiene muchos currículos de trabajo.
Sin embargo, es una buena solución para extraer contenido de texto.
Me gustaría probar la API de scribd
o la API del documento de Google Apps. GOogle hace un gran trabajo visualizando y convirtiendo archivos pdf