tiempo tendencias serie pronosticos multivariadas funcion diarias correlograma comando analisis r time-series

tendencias - series de tiempo diarias en r



Analizando datos diarios/semanales usando ts en R (5)

Acabo de empezar a jugar con la clase ts para analizar algunos datos de series de tiempo que tengo.

Tengo la sensación de que la clase ts no es adecuada para analizar datos diarios o semanales. Casi todos los ejemplos que veo en la web o en "Series de tiempo introductorias con R" de Cowpertwait y Metcalfe utilizan datos mensuales o anuales.

Me gustaría usar ts para analizar datos semanales, ¿no es recomendable?


El principal problema es que la mayoría de las personas que desean analizar datos diarios o semanales desean hacer algo como usar una frecuencia de 365 días al año o 52 semanas al año, pero el número de días o semanas en un año no es de 365 o 52 o incluso constante. Si abandona un día en años bisiestos en el caso de los datos diarios, digamos, o use 7 días para cada semana del año, excepto uno que tenga 8 o 9 días en el caso de los datos semanales, digamos, entonces puede manipularlo. Una variedad infinita de esquemas es posible.

Lea este hilo para ver un ejemplo.


La clase ts es adecuada para cualquier tipo de información que tenga intervalos estrictamente metronómicos entre observaciones. Si ese intervalo es de años, meses, días, minutos no hace ninguna diferencia. Esto lo hace muy adecuado para muchos datos científicos, por ejemplo, observaciones meteorológicas.

Sin embargo, una gran clase de datos relacionados con el tiempo tiene lagunas. Tomemos, por ejemplo, precios de cierre de acciones que no existen para los días de fin de semana. Para este tipo de datos, sería mejor utilizar los paquetes xts (series temporales extensibles) o zoo (observaciones ordenadas de Z, donde Z es la inicial de uno de los autores del paquete).

Enlaces a CRAN:


La unidad de tiempo no entra en juego; solo la cantidad de puntos de datos por unidad (la frecuencia). En lo que respecta a sus funciones y su cuidado, un día es un año, una década es lo que sea. En ningún momento le dice que el tiempo hasta el que se trata es de una semana o un día. ¡No importa!


Supongo que el problema con los datos diarios / semanales es que ambos tienen unidades de salto. Cada cuarto año tiene un adicional de 366 días y cada cuarto año tiene 53 semanas. O ha tenido desde 1900. Entonces, la "frecuencia" no es constante o es una fracción. De lo contrario, ts debería funcionar bien.

La forma más fácil para las semanas es usar la fecha de inicio de la semana. En sistemas unixlike, también puede usar semanas ISO, y también hay un paquete que los implementa. Por supuesto, si sus datos ya están en semanas, solo los necesita para etiquetar los gráficos, etc.


Zoo funciona bien con datos diarios. Por ejemplo, si tenía una serie diaria de flujos de flujo en un vector Q y con las correspondientes marcas de fecha D (creadas usando as.Date (), por ejemplo).

Qz <- zoo (Q, order.by = D)

creará un objeto que se trazará bien y puede usar funciones como window () para extraer años individuales, por ejemplo

ventana (Qz, start = as.Date (''2000-01-01''), end = as.Date (''2000-31-12'')

Verifique el paquete del zoológico para más información.