tag parsear parse htmlparse fromstring data python console text-files

parsear - Efecto en el rendimiento del uso de sentencias de impresión en el script Python



python parse string to html (1)

Intenté hacerlo en un guión muy simple solo por diversión, la diferencia es bastante asombrosa:

En large.py:

target = open(''target.txt'', ''w'') for item in xrange(4000000): target.write(str(item)+''/n'') print item

A tiempo:

[gp@imdev1 /tmp]$ time python large.py real 1m51.690s user 0m10.531s sys 0m6.129s gp@imdev1 /tmp]$ ls -lah target.txt -rw-rw-r--. 1 gp gp 30M Nov 8 16:06 target.txt

Ahora ejecutando lo mismo con "imprimir" comentó:

gp@imdev1 /tmp]$ time python large.py real 0m2.584s user 0m2.536s sys 0m0.040s

Tengo un script de Python que procesa un gran archivo de texto (con alrededor de 4 millones de líneas) y escribe los datos en dos archivos separados.

He añadido una declaración de impresión, que genera una cadena para cada línea para la depuración. ¿Quiero saber qué tan malo podría ser desde la perspectiva del rendimiento?

Si va muy mal, puedo eliminar la línea de depuración.

Editar

Resulta que tener una declaración de impresión para cada línea en un archivo con 4 millones de líneas está aumentando el tiempo demasiado.