rpubs - series de tiempo diarias en r
Trazado promedio de mĂșltiples variables en series temporales usando ggplot (1)
Tengo un archivo que contiene datos de series de tiempo para múltiples variables desde a hasta k.
Me gustaría crear un gráfico que traza el promedio de las variables de la ak a lo largo del tiempo y por encima y por debajo de esa línea promedio agrega un área suavizada que representa la variación máxima y mínima en cada día.
Entonces algo así como intervalos de confianza pero en una versión suavizada.
Aquí está el conjunto de datos: https://dl.dropbox.com/u/22681355/co.csv
y aquí está el código que tengo hasta ahora:
library(ggplot2)
library(reshape2)
meltdf <- melt(df,id="Year")
ggplot(meltdf,aes(x=Year,y=value,colour=variable,group=variable)) + geom_line()
Esto representa intervalos de confianza bootstrapped del 95%:
ggplot(meltdf,aes(x=Year,y=value,colour=variable,group=variable)) +
stat_summary(fun.data = "mean_cl_boot", geom = "smooth")
Esto representa la media de todos los valores de todas las variables + -1SD:
ggplot(meltdf,aes(x=Year,y=value)) +
stat_summary(fun.data ="mean_sdl", mult=1, geom = "smooth")
Es posible que desee calcular el año significa antes de calcular los medios y SD sobre las variables, pero se lo dejo a usted.
Sin embargo, creo que un intervalo de confianza Boostrap sería más sensato, ya que la distribución no es claramente simétrica. También sería más estrecho. ;)
Y, por supuesto, puede registrar-transformar sus valores.