titulo longitud etiqueta description descripcion crear como r dataframe h2o

longitud - meta title y meta descripcion



No se puede convertir el marco de datos al objeto h2o (4)

Estoy ejecutando el paquete h2o en Rstudio versión 0.99.447. Ejecuto la versión 10.9.5 OSX.

Me gustaría configurar un clúster local dentro de R, siguiendo los pasos de este tutorial: http://blenditbayes.blogspot.co.uk/2014/07/things-to-try-after-user-part-1-deep .html

El primer paso no parece ser un problema. Lo que parece ser un problema es convertir mi marco de datos a un objeto h2o adecuado.

library(mlbench) dat = BreastCancer[,-1] #reading in data set from mlbench package library(h2o) localH2O <- h2o.init(ip = "localhost", port = 54321, startH2O = TRUE) #sets up the cluster dat_h2o <- as.h2o(localH2O, dat, key = ''dat'') #this returns an error message

La instrucción anterior as.h2o da como resultado el siguiente mensaje de error

Error in as.h2o(localH2O, dat, key = "dat") : unused argument (key = "dat")

Si elimino el parámetro "clave", dejando que los datos residan en el almacén de valores-clave H2O bajo un nombre generado por la máquina, aparece el siguiente mensaje de error.

Error in .h2o.doSafeREST(conn = conn, h2oRestApiVersion = h2oRestApiVersion, Unexpected CURL error: Empty reply from server

Esta pregunta me pregunta lo mismo que yo, pero la solución me lleva al mismo error.

¿Alguien tiene experiencia con este problema? No estoy del todo seguro de cómo abordar esto.


La sintaxis para importar una trama de R a H2O ha cambiado desde la última versión estable de H2O-Classic y la última versión estable de H2O-3.0. Creo que usaste una versión H2O-3.0 que significa que algunos de los argumentos en las funciones han cambiado desde entonces, el argumento "clave" ambiguo ha sido cambiado a "marco_destino".

H2O-3.0 se comportará de manera diferente, ya que notará que las primeras 5 columnas son factores ordenados en el marco de datos R; y por el momento no tenemos una forma de preservar los pedidos de columnas categóricas. Sin embargo, para reproducir los mismos resultados que el publicado en http://blenditbayes.blogspot.co.uk/2014/07/things-to-try-after-user-part-1-deep.html , tendrá que por ahora, escriba el marco en el disco como un archivo CSV e impórtelo a H2O.

library(mlbench) dat = BreastCancer[,-1] #reading in data set from mlbench package library(h2o) localH2O <- h2o.init(ip = "localhost", port = 54321, startH2O = TRUE) #dat_h2o <- as.h2o(dat, destination_frame = ''dat'') ## Will return a "Provided column type c("ordered", "enum") is unknown." error pathToData <- paste0(normalizePath("~/Downloads/"), "/dat.csv") write.table(x = dat, file = pathToData, row.names = F, col.names = T) dat_h2o <- h2o.importFile(path = pathToData, destination_frame = "dat")

Para R data.frames que no tienen columnas de factores ordenados, simplemente puede usar h2o_frame <- as.h2o(object = df) donde class(df) es un data.frame .


También estaba enfrentando el mismo problema. En mi caso, el problema JAVA_HOME env variable en Mac OSX Mavericks apuntando a la versión anterior de Java 6. Mi solución está en h2o google groups stream here


El marco de datos BreastCancer tiene 5 ord.factors y 5 factors. Como escribió Amy Wang, debes convertir los factores en numéricos. Si no desea escribir datos en el disco y luego volver a leer los datos, puede convertirlos con sapply ().

## Format data with no factor data(BreastCancer, package = ''mlbench'') # Load data from mlbench package dat <- BreastCancer[, -1] # Remove the ID column dat[, c(1:ncol(dat))] <- sapply(dat[, c(1:ncol(dat))], as.numeric) # Convert factors into numeric ## Start a local cluster with default parameters library(h2o) localH2O <- h2o.init(ip = "localhost", port = 54321, startH2O = TRUE) ## Convert Breast Cancer into H2O dat.h2o <- as.h2o(dat, destination_frame = "midata")


Deberías intentarlo:

dat_h2o <- as.h2o(dat)

O:

dat <- as.data.frame(dat) dat_h2o <- as.h2o(dat)

¡Espero que esto ayude!