ejemplos - Extrae el archivo bz2 en R
descomprimir zip linux terminal (5)
Básicamente, necesitas escribir:
library(R.utils)
bunzip2("dataset.csv.bz2", "dataset.csv", remove = FALSE, skip = TRUE)
dataset <- read.csv("dataset.csv")
Vea la documentación aquí: bunzip2 {R.utils} .
Tengo un montón de archivos .csv.bz2
, que .csv.bz2
descargar, extraer y leer en R. Descargué el archivo y deseo extraerlo al directorio de trabajo actual, luego lo leí. unz(filename,filename.csv)
pero parece que no funciona. ¿Cómo puedo hacer eso?
Escuché en algún lugar que los archivos bz se pueden leer directamente sin descomprimir. ¿Cómo puedo hacer eso?
De acuerdo con la descripción de la read.table de read.table , se puede leer un archivo comprimido directamente.
read.table("file.csv.bz2")
En los sistemas Linux puede hacer uso del fread
super rápido
require(data.table)
fread(sprintf("bzcat %s | tr -d ''//000''", "file.csv.bz2"))
Referencia: https://gist.github.com/wush978/93c0f96b68f529678e2d
Me gusta esto:
readcsvbz2file <- read.csv(bzfile("file.csv.bz2"))
Puedes usar cualquiera de estos dos comandos:
read.csv()
: con este comando puede suministrar directamente su nombre de archivo comprimido que contiene el archivo csv.read.csv("file.csv.bz2")
read.table()
: este comando es una versión genérica delread.csv()
. Puede configurar delimitadores y otras opciones queread.csv()
establece automáticamente. No es necesario descomprimir el archivo por separado. Este comando lo hace automáticamente por ti.read.csv("file.csv.bz2", header = TRUE, sep = ",", quote = "/"",...)