t3font_0 que puede porque para paquete pagina necesita mostrar letras letra incrustar fuentes fuente esta erroneos descargar correctamente contiene cambia anchos pdf fonts scripting flash extract
http://mupdf.googlecode.com/files/mupdf-0.8.15-windows.zip

que - Extraiga fuentes PDF incrustadas a un archivo ttf externo utilizando alguna utilidad o script



porque el pdf me cambia la letra (5)

¿Es posible extraer fuentes que están incrustadas en un archivo PDF en un archivo externo ttf usando alguna utilidad o script?

  1. Si las fuentes que están incrustadas (o no incrustadas) en un archivo PDF están presentes en el sistema. Utilizando las herramientas pdf2swf y swfextract de swftools, puedo determinar los nombres de las fuentes utilizadas en un archivo PDF. Luego puedo compilar las fuentes del sistema respectivas en tiempo de ejecución y luego cargarlas en mi aplicación de AIR.

  2. PERO si las fuentes utilizadas en el PDF están ausentes en el sistema, hay dos posibilidades:

    2.1. Si también están ausentes en los archivos PDF (no incrustados), solo podemos usar bases de fuente de sistema similares en el nombre de la fuente.

    2.2. Si están incrustados en el archivo PDF, entonces quiero saber si es posible extraerlos a un archivo externo ttf para que pueda compilarlos en archivos SWF en tiempo de ejecución.


Es una respuesta tardía, pero encontré la manera de hacerlo utilizando programas de Windows disponibles gratuitamente. No requerirá secuencias de comandos o compilación o cygwin. Son algunos pasos, pero no tan malos como parecen.

  1. Instale el enlace mupdf - http://mupdf.googlecode.com/files/mupdf-0.8.15-windows.zip y copie su pdf a la carpeta de instalación de mupdf. Digamos que se llama whatever.pdf.

  2. Abra un indicador dos / command. Navega a tu carpeta de instalación de mupdf. ejemplo: cd C: / Program Files / mupdf ... Si todo va bien, su mensaje ahora debería verse así: C: / Program Files / mupdf> Ahora escriba el siguiente comando: pdfextract whatever.pdf

Luego, dentro de la carpeta del programa mupdf, tendrá uno o más archivos de fuentes. Tendrán nombres como ABCDEF + Fontname-12.cff ... En este momento están en el formato .cff inutilizable, pero lo solucionaremos. Recomiendo cambiarle el nombre a algo menos incómodo ... por ejemplo whatever.cff

  1. Más DOS, lo siento. Necesita una herramienta llamada cfftot1.exe. Aquí hay un enlace: ftp://tug.org/texlive/Contents/live/bin/win32/cfftot1.exe ... Cópielo en su carpeta mupdf. Luego escribe esto: cfftot1 whatever.cff whatever.pfb

  2. Ahora tiene un archivo de fuente casi utilizable llamado whatever.pfb. Digo ''casi'' porque generalmente los archivos de fuentes PFB también vienen con un segundo archivo, un archivo PFM que contiene información de espaciado. Sin este archivo, la fuente no se instalará y el espaciado se arruinará. Pero la fuente seguirá abierta en editores de fuentes como fontlab. Puede guardar la fuente desde allí a TTF o OTF. También puede intentar arreglar el espaciado usted mismo.

Si no tiene un editor de fuentes, puede usar crossfont. Crossfont puede tomar el PFB y generar el archivo PFM necesario para que al menos pueda instalar y usar la fuente. enlace - http://crossfont.en.softonic.com/

Eso es.


Sé que ha pasado un tiempo desde que preguntaste esto, pero pensé que podría ayudarte.

No sé si hay alguna utilidad que le permita extraer los archivos de fuentes, pero puede hacerlo manualmente.

Básicamente, un archivo PDF es un archivo de texto con diferentes objetos. Puede abrirlo con cualquier editor de texto y buscar las fuentes.

Las fuentes se especifican en objetos FontDescriptor, por ejemplo:

<</Type/FontDescriptor/FontName/ABCDEE+Algerian ... /FontFile2 24 0 R>>

Esto básicamente dice, una fuente con el nombre Argelino se especifica en el objeto 24. Puede buscar el documento para el objeto 24 con la línea "24 0 obj", después de esta línea, muestra las propiedades de la secuencia con el archivo de fuente y después de la palabra clave "stream" comienza (su longitud se define en la línea después del obj).

Esta secuencia contiene el archivo ttf, comprimido, para descomprimirlo puedes usar este método:

private static byte[] DecodeFlateDecodeData(byte[] data) { MemoryStream outputStream; using (outputStream = new MemoryStream()) { using (var compressedDataStream = new MemoryStream(data)) { // Remove the first two bytes to skip the header (it isn''t recognized by the DeflateStream class) compressedDataStream.ReadByte(); compressedDataStream.ReadByte(); var deflateStream = new DeflateStream(compressedDataStream, CompressionMode.Decompress, true); var decompressedBuffer = new byte[1024]; int read; while ((read = deflateStream.Read(decompressedBuffer, 0, decompressedBuffer.Length)) != 0) { outputStream.Write(decompressedBuffer, 0, read); } outputStream.Flush(); compressedDataStream.Close(); } return GetStreamBytes(outputStream); } }

Espero que esto te ayude ... o ayude a alguien más


Hace algunos años, diseñé una fuente especial. Me llevó aproximadamente un año de trabajo intermitente. Un día, mi Maxtor HDD murió y no había forma de que pudiera recuperar mi trabajo. Pero tenía la fuente incrustada en algunos archivos PDF para mis clientes. Entonces tengo la idea de extraer fuentes de estos archivos. Después de un año más o menos buscando en línea una respuesta, armé un método para extraer fuentes de PDF. Presenté este método en mi blog en http://pdffontextract.blogspot.com . Desde que surgió esta solución surgieron muchas alternativas pero no hay nada de malo en la diversidad. Hice esta publicación para ayudar a otros que necesitan recuperar su trabajo perdido. Diviértete y si necesitas ayuda no dudes en contactarme.



Actualización menor: algunos archivos PDF contienen fuentes incrustadas en otro formato único, como archivos .CID. Este formato está hecho para fuentes que admiten una gran cantidad de caracteres (por ejemplo, fuentes de idiomas asiáticos) y no asigna los glifos a las letras de una manera típica.

Todavía puede obtener fuentes utilizables de un archivo .CID, solo necesita agregar un paso a mi respuesta anterior. Ejecute su PDF a través de un programa llamado PStill (GPStill). El sitio web está aquí: http://www.wizards.de/~frank/pstill.html

Al elegir su entrada, cambie el menú desplegable de Archivo Postscript a Archivo PDF. Su PDF de salida tendrá _new anexado. Si necesita desbloquear un PDF, puede usar Advanced PDF Password Recovery de Elcomsoft.

Lo que hace este paso es convertir las fuentes CID incrustadas en las fuentes PDF a PFA tipo 1. Entonces, después de ejecutar PDFextract, en lugar de un montón de archivos .CID inútiles, tiene archivos .PFA que se pueden importar a Fontlab y posiblemente a Crossfont. Tenga en cuenta que las letras probablemente no se correlacionarán correctamente, por lo que realmente desea que algo como Fontlab las mueva para que, por ejemplo, al escribir A en su teclado no se obtenga la letra R.

Como siempre, si la fuente solo se incrustó como un subconjunto, no obtendrá la fuente completa, solo un conjunto limitado de letras.