do parallel r
¿Cómo puedo usar el procesamiento de múltiples núcleos para ejecutar la función glm más rápido? (2)
Soy un poco nuevo para r y me gustaría usar un paquete que permita el procesamiento de múltiples núcleos para ejecutar la función glm más rápido. Me pregunto si hay una sintaxis que pueda usar para este asunto. Aquí hay un ejemplo de modelo de glm que escribí, ¿puedo agregar un parámetro que use múltiples núcleos?
g<-glm(IsChurn~.,data=dat,family=''binomial'')
Gracias.
Otros paquetes útiles son: http://cran.r-project.org/web/packages/gputools/gputools.pdf con gpuGlm y http://cran.r-project.org/web/packages/mgcv/mgcv.pdf vea la sección mgcv.parallel sobre gam(..., control=list(nthreads=nc))
o bam(..., cluster=makeCluster(nc))
donde nc es el número de sus núcleos reales
Usé speedglm y los resultados son muy buenos: al usar glm tardé 14.5 segundos en obtener resultados y con speedglm tardé 1.5 segundos. que una mejora del 90% ... el código es muy simple: m <- speedglm(y ~ s1 + s2,data=df)
. Solo no olvides instalar y llamar al paquete. Otro problema: no puede usar todas las variables con "." speedglm no reconoce el punto como "todas las variables".