q16 not lote jpg imagenes im6 example desde crear convertir convert authorized linux perl pdf

not - crear pdf imagenes linux



¿Cómo puedo automatizar las conversiones de HTML a PDF? (9)

He estado usando htmldoc por un tiempo, pero me he encontrado con algunas limitaciones bastante serias. Necesito la solución final para trabajar en una caja de Linux. Voy a llamar a esta biblioteca / utilidad / aplicación desde una aplicación Perl, por lo que cualquier interfaz Perl sería una ventaja.


Deberías echarle un vistazo a http://phantomjs.org/

La conversión se puede hacer mediante un pequeño script rasterize.js y luego emitiendo

phantomjs rasterize.js ''http://en.wikipedia.org/w/index.php?title=Jakarta&printable=yes'' jakarta.pdf


Es posible que desee consultar el ''Servicio de conversión de documentos'' de Peernet (en http://www.peernet.com/conversion-software/batch-document-converter/ ). Esto se ejecuta como un servicio en un equipo con Windows Desktop o Windows Server. Abre documentos HTML en un navegador web y luego los imprime a través de un controlador de impresión para crear documentos PDF, de modo que el documento PDF producido se vea exactamente como si hubiera impreso el documento HTML desde el navegador.


Esto sería una exageración total, pero podría descargar e instalar mirth . Es un motor de enrutamiento de mensajes, pero tiene la capacidad de convertir html a pdf, por lo que puede configurarlo para recoger un archivo html en una carpeta, convertirlo a PDF y soltar el pdf en la misma carpeta u otra. Como dije, exagerado, un poco de una curva de aprendizaje, pero es gratis, y Java para que puedas ejecutarlo en Linux si quieres. Y toda tu aplicación PERL tendría que hacer es soltar el html a un archivo.


Hay un nuevo modo sin cabeza desde Chrome 59. Como todas las otras soluciones realmente tienen dificultades con las funciones CSS más nuevas (o no tan nuevas) como flexbox, esta fue en mi caso la única solución para producir una salida PDF adecuada.

Para crear un pdf desde un archivo html local simplemente use el siguiente comando: chrome --headless --disable-gpu --print-to-pdf file:///path/to/myfile.html .

Para Mac OS, sustituya chrome con /Applications/Google/ Chrome.app/Contents/MacOS/Google/ Chrome .

El único inconveniente que noté hasta ahora es que (actualmente) no se puede pasar el html vía stdin, pero crear un archivo temporal no es un gran problema.

Para obtener más información, consulte https://developers.google.com/web/updates/2017/04/headless-chrome#create_a_pdf_dom

Actualización: Como resultado, los chicos de Chrome muy probablemente proporcionarán algún tipo de módulo de nodo para esta tarea, lo que eventualmente desaprobaría el modo sin cabeza ( https://bugs.chromium.org/p/chromium/issues/detail?id=719921 ).

La mejor opción sería utilizar el enfoque basado en nodo utilizando el módulo titiritero como se documenta en https://developers.google.com/web/updates/2017/04/headless-chrome#node e imprimir la página a través de Page.printToPDF comando, que también permite algunas configuraciones adicionales.

Por supuesto, también puede conectarse a la consola de depuración websocket desde cualquier otro entorno que no sea nodo (es decir, script PHP).


Hice un poco de google para ti y se me ocurrieron dos opciones. Puede haber más, mi estrategia de google fue probar "webkit línea de comando pdf" y "gecko línea de comando pdf", básicamente buscando programas de línea de comandos que incorporen los dos populares motores de código abierto en los procesadores de líneas de comando. Esto es lo que encontré:

Impresora de línea de comandos de Firefox - salidas a pdf y png

wkpdf : aunque esto es para Mac, probablemente sea bastante portátil.


No voy a decir que esta es la "mejor" solución, pero es "una" solución que he usado.

Entrada de HTML -> HTML 2 PS -> PDF de PS 2 -> PDF de salida


Perdón por descubrir esta publicación anterior, pero salió primero en mi búsqueda de la mejor herramienta de conversión de HTML / PDF. En Linux, wkhtmltopdf es muy bueno (tiene en cuenta CSS, entre otros) y GPL.


WeasyPrint produce buenos PDF con texto e hipervínculos seleccionables.

weasyprint input.html output.pdf

Si usa wkhtmltopdf cambio, pruebe las siguientes opciones:

wkhtmltopdf --margin-bottom 20mm --margin-top 20mm --minimum-font-size 16 ...