datos - Cómo leer un archivo.csv que contiene apóstrofes en R?
leer datos en r (3)
De forma predeterminada, read.table
ve read.table
simples y dobles para citar caracteres. Necesita agregar quote="/""
a su llamada a read.table
. O bien, podría usar read.csv
, que solo ve comillas dobles para citar caracteres de forma predeterminada.
Tengo dificultades para que R lea un archivo .txt o .csv que contenga apóstrofos.
Algunas de mis columnas contienen texto descriptivo, como "Atiende las necesidades de los clientes" o "Diputado del sheriff". Mi archivo se abre correctamente en Excel (es decir, todos los datos aparecen en las celdas correctas; hay 3 columnas y alrededor de 8000 filas, y no hay datos faltantes). Pero cuando le pido a R que lea el archivo, esto es lo que sucede:
data <-read.table("datafile.csv", sep=",", header=TRUE)
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
line 520 did not have 3 elements
(La línea 520 es la primera línea que contiene un apóstrofo).
Si entro en el archivo .txt o .csv y elimino manualmente todos los apóstrofos, R leerá el archivo correctamente. Sin embargo, prefiero mantener los apóstrofos si puedo.
Soy nuevo en R y estaría agradecido por cualquier ayuda.
Establecer el parámetro quote = "//" en read.table debería hacer el truco.
Estudiar a fondo las opciones en? Read.table dará sus frutos a largo plazo. Los valores predeterminados para citar caracteres son quote = "/" ''", que en realidad son solo dos caracteres después de que R analiza esa expresión, comillas simples y comillas dobles. Puede eliminarlas de la consideración con quotes=NA
. A veces es necesario también eliminar el valor predeterminado ''comment.char'' a "#", y puede ser útil cambiar ''as.is'' a TRUE para evitar que las cadenas se conviertan en factores.