r import read.table

No se puede leer el archivo con "#" y espacio usando read.table o read.csv en R



import (1)

De la documentación ( ?read.csv ):

carácter comment.char : un vector de caracteres de longitud uno que contiene un solo carácter o una cadena vacía. Utilice "" para desactivar la interpretación de los comentarios por completo.

El valor predeterminado es comment.char = "#" que le está causando problemas. Siguiendo la documentación, debes usar comment.char = "" .

Los espacios en el encabezado son otra cuestión que, como mrdwab señaló amablemente, se puede solucionar configurando check.names = FALSE .

chromosomes <- read.csv(chromFile, sep = "/t", skip = 0, header = TRUE, comment.char = "", check.names = FALSE)

Tengo un archivo donde la primera fila es un encabezado. El encabezado puede tener espacios y el símbolo # (también puede haber otros caracteres especiales). Estoy tratando de leer este archivo usando read.csv o read.table pero me sigue arrojando errores:

undefined columns selected more columns than column names

Mi archivo chromFile delimitado por tabuladores se parece a:

Chromosome# Chr chr Size UCSC NCBI36/hg18 NCBIBuild36 NCBIBuild37 1 Chr1 chr1 247199719 247249719 247249719 249250621 2 Chr2 chr2 242751149 242951149 242951149 243199373

Mando:

chromosomes <- read.csv(chromFile, sep="/t",skip =0, header = TRUE, )

Primero quiero buscar una manera de leer el archivo tal como está sin reemplazar el espacio o # con algún otro símbolo legible.