longitud - meta title y meta descripcion
No se puede convertir el marco de datos al objeto h2o (4)
Estoy ejecutando el paquete h2o en Rstudio versión 0.99.447. Ejecuto la versión 10.9.5 OSX.
Me gustaría configurar un clúster local dentro de R, siguiendo los pasos de este tutorial: http://blenditbayes.blogspot.co.uk/2014/07/things-to-try-after-user-part-1-deep .html
El primer paso no parece ser un problema. Lo que parece ser un problema es convertir mi marco de datos a un objeto h2o adecuado.
library(mlbench)
dat = BreastCancer[,-1] #reading in data set from mlbench package
library(h2o)
localH2O <- h2o.init(ip = "localhost", port = 54321, startH2O = TRUE) #sets up the cluster
dat_h2o <- as.h2o(localH2O, dat, key = ''dat'') #this returns an error message
La instrucción anterior as.h2o da como resultado el siguiente mensaje de error
Error in as.h2o(localH2O, dat, key = "dat") :
unused argument (key = "dat")
Si elimino el parámetro "clave", dejando que los datos residan en el almacén de valores-clave H2O bajo un nombre generado por la máquina, aparece el siguiente mensaje de error.
Error in .h2o.doSafeREST(conn = conn, h2oRestApiVersion = h2oRestApiVersion,
Unexpected CURL error: Empty reply from server
Esta pregunta me pregunta lo mismo que yo, pero la solución me lleva al mismo error.
¿Alguien tiene experiencia con este problema? No estoy del todo seguro de cómo abordar esto.
La sintaxis para importar una trama de R a H2O ha cambiado desde la última versión estable de H2O-Classic y la última versión estable de H2O-3.0. Creo que usaste una versión H2O-3.0 que significa que algunos de los argumentos en las funciones han cambiado desde entonces, el argumento "clave" ambiguo ha sido cambiado a "marco_destino".
H2O-3.0 se comportará de manera diferente, ya que notará que las primeras 5 columnas son factores ordenados en el marco de datos R; y por el momento no tenemos una forma de preservar los pedidos de columnas categóricas. Sin embargo, para reproducir los mismos resultados que el publicado en http://blenditbayes.blogspot.co.uk/2014/07/things-to-try-after-user-part-1-deep.html , tendrá que por ahora, escriba el marco en el disco como un archivo CSV e impórtelo a H2O.
library(mlbench)
dat = BreastCancer[,-1] #reading in data set from mlbench package
library(h2o)
localH2O <- h2o.init(ip = "localhost", port = 54321, startH2O = TRUE)
#dat_h2o <- as.h2o(dat, destination_frame = ''dat'')
## Will return a "Provided column type c("ordered", "enum") is unknown." error
pathToData <- paste0(normalizePath("~/Downloads/"), "/dat.csv")
write.table(x = dat, file = pathToData, row.names = F, col.names = T)
dat_h2o <- h2o.importFile(path = pathToData, destination_frame = "dat")
Para R data.frames que no tienen columnas de factores ordenados, simplemente puede usar h2o_frame <- as.h2o(object = df)
donde class(df)
es un data.frame
.
También estaba enfrentando el mismo problema. En mi caso, el problema JAVA_HOME env variable en Mac OSX Mavericks apuntando a la versión anterior de Java 6. Mi solución está en h2o google groups stream here
El marco de datos BreastCancer tiene 5 ord.factors y 5 factors. Como escribió Amy Wang, debes convertir los factores en numéricos. Si no desea escribir datos en el disco y luego volver a leer los datos, puede convertirlos con sapply ().
## Format data with no factor
data(BreastCancer, package = ''mlbench'') # Load data from mlbench package
dat <- BreastCancer[, -1] # Remove the ID column
dat[, c(1:ncol(dat))] <- sapply(dat[, c(1:ncol(dat))], as.numeric) # Convert factors into numeric
## Start a local cluster with default parameters
library(h2o)
localH2O <- h2o.init(ip = "localhost", port = 54321, startH2O = TRUE)
## Convert Breast Cancer into H2O
dat.h2o <- as.h2o(dat, destination_frame = "midata")
Deberías intentarlo:
dat_h2o <- as.h2o(dat)
O:
dat <- as.data.frame(dat)
dat_h2o <- as.h2o(dat)
¡Espero que esto ayude!