Leyendo archivos de texto usando read.table
(1)
Tengo un archivo de texto con una columna de id
y name
, y estoy intentando leerlo en un marco de datos en R:
d = read.table("foobar.txt", sep="/t")
Pero por alguna razón, muchas líneas se fusionan, por ejemplo, en la fila 500 de mi marco de datos, veré algo como
row 500: 500 Bob/n501/tChris/n502/tGrace
[Entonces, si mi archivo de texto original tiene, digamos, 5000 líneas, las dimensiones de mi tabla solo terminarán siendo 1000 filas y 2 columnas.]
Esto me ha pasado algunas veces. ¿Alguien sabe cuál es el problema o cómo solucionarlo?
From ?read.table
: el número de columnas de datos se determina mirando las primeras cinco líneas de entrada (o todo el archivo si tiene menos de cinco líneas), o la longitud de col.names si está especificado y es más. Esto podría ser incorrecto si fill o blank.lines.skip son verdaderos, por lo tanto, especifique col.names si es necesario.
Entonces, tal vez su archivo de datos no esté limpio. Ser más específico ayudará a la importación de datos:
d = read.table("foobar.txt",
sep="/t",
col.names=c("id", "name"),
fill=FALSE,
strip.white=TRUE)
especificará las columnas exactas y el fill=FALSE
forzará un marco de datos de dos columnas.