tablas - Python Pandas: ¿cómo leer solo las primeras n filas de archivos CSV?
leer columnas en python (1)
Tengo un conjunto de datos muy grande y no puedo permitirme leer todo el conjunto de datos. Por lo tanto, estoy pensando en leer solo una parte para entrenar, pero no tengo idea de cómo hacerlo. Cualquier pensamiento será apreciado.
Si solo desea leer las primeras filas de 999.999 (sin encabezado):
read_csv(..., nrows=999999)
Si solo quieres leer las filas 1,000,000 ... 1,999,999
read_csv(..., skiprows=1000000, nrows=999999)
nrows : int, default Ninguno Número de filas de archivo para leer. Útil para leer fragmentos de archivos grandes *
skiprows : en forma de lista o entero Números de fila para omitir (0-indexados) o número de filas para omitir (int) al comienzo del archivo
y para archivos grandes, probablemente también quieras usar chunksize:
chunksize : int, default Ninguno Devuelve el objeto TextFileReader para la iteración