parsear - Efecto en el rendimiento del uso de sentencias de impresión en el script Python
python parse string to html (1)
Intenté hacerlo en un guión muy simple solo por diversión, la diferencia es bastante asombrosa:
En large.py:
target = open(''target.txt'', ''w'')
for item in xrange(4000000):
target.write(str(item)+''/n'')
print item
A tiempo:
[gp@imdev1 /tmp]$ time python large.py
real 1m51.690s
user 0m10.531s
sys 0m6.129s
gp@imdev1 /tmp]$ ls -lah target.txt
-rw-rw-r--. 1 gp gp 30M Nov 8 16:06 target.txt
Ahora ejecutando lo mismo con "imprimir" comentó:
gp@imdev1 /tmp]$ time python large.py
real 0m2.584s
user 0m2.536s
sys 0m0.040s
Tengo un script de Python que procesa un gran archivo de texto (con alrededor de 4 millones de líneas) y escribe los datos en dos archivos separados.
He añadido una declaración de impresión, que genera una cadena para cada línea para la depuración. ¿Quiero saber qué tan malo podría ser desde la perspectiva del rendimiento?
Si va muy mal, puedo eliminar la línea de depuración.
Editar
Resulta que tener una declaración de impresión para cada línea en un archivo con 4 millones de líneas está aumentando el tiempo demasiado.