varias superponer poligono ojiva lineas graficos graficas ggplot frecuencia r plot

superponer - Acelera la función plot() para grandes conjuntos de datos



superponer graficas en r ggplot (3)

¿Has mirado el paquete tabplot? está diseñado específicamente para datos grandes http://cran.r-project.org/web/packages/tabplot/ Lo uso más rápido que usando hexbin (o incluso las parcelas de girasol predeterminadas para el sobreplote)

También creo que Hadley escribió algo en el blog de DS modificando ggplot para big data en http://blog.revolutionanalytics.com/2011/10/ggplot2-for-big-data.html

"" "Actualmente estoy trabajando con otro estudiante, Yue Hu, para convertir nuestra investigación en un paquete R robusto". "21 de octubre de 2011

Tal vez podamos preguntarle a Hadley si el ggplot3 actualizado está listo

Estoy usando plot() para más de 1 millón de puntos de datos y resulta ser muy lento.

¿Hay alguna forma de mejorar la velocidad, incluidas las soluciones de programación y hardware (más RAM, tarjeta gráfica ...)?

¿Dónde se almacenan los datos para la trama?


En realidad, un gráfico de hexbin le muestra algo (a diferencia del diagrama de dispersión que @Roland propone en los comentarios, que es probable que solo sea un gigante, lento, blob) y toma unos 3.5 segundos en mi máquina para su ejemplo:

set.seed(101) a<-rnorm(1E7,1,1) b<-rnorm(1E7,1,1) library(hexbin) system.time(plot(hexbin(a,b)))


Una forma fácil y rápida es establecer pch=''.'' . El rendimiento se muestra a continuación.

x=rnorm(10^6) > system.time(plot(x)) user system elapsed 2.87 15.32 18.74 > system.time(plot(x,pch=20)) user system elapsed 3.59 22.20 26.16 > system.time(plot(x,pch=''.'')) user system elapsed 1.78 2.26 4.06