r read.table

Leyendo archivos de texto usando read.table



(1)

Tengo un archivo de texto con una columna de id y name , y estoy intentando leerlo en un marco de datos en R:

d = read.table("foobar.txt", sep="/t")

Pero por alguna razón, muchas líneas se fusionan, por ejemplo, en la fila 500 de mi marco de datos, veré algo como

row 500: 500 Bob/n501/tChris/n502/tGrace

[Entonces, si mi archivo de texto original tiene, digamos, 5000 líneas, las dimensiones de mi tabla solo terminarán siendo 1000 filas y 2 columnas.]

Esto me ha pasado algunas veces. ¿Alguien sabe cuál es el problema o cómo solucionarlo?


From ?read.table : el número de columnas de datos se determina mirando las primeras cinco líneas de entrada (o todo el archivo si tiene menos de cinco líneas), o la longitud de col.names si está especificado y es más. Esto podría ser incorrecto si fill o blank.lines.skip son verdaderos, por lo tanto, especifique col.names si es necesario.

Entonces, tal vez su archivo de datos no esté limpio. Ser más específico ayudará a la importación de datos:

d = read.table("foobar.txt", sep="/t", col.names=c("id", "name"), fill=FALSE, strip.white=TRUE)

especificará las columnas exactas y el fill=FALSE forzará un marco de datos de dos columnas.