separar - ordenar fechas en r
creando una secuencia de fechas para cada grupo en r (1)
Puede usar data.table
para obtener la sequence
de fechas desde ''created_at'' hasta ''2015-07-12'', agrupadas por la columna ''ID''.
library(data.table)
setDT(df1)[, list(date=seq(created_at, as.Date(''2015-07-12''), by=''1 day'')) , ID]
Si necesita una opción con dplyr
, use do
library(dplyr)
df1 %>%
group_by(ID) %>%
do( data.frame(., Date= seq(.$created_at,
as.Date(''2015-07-12''), by = ''1 day'')))
Si tiene ID duplicados, entonces es posible que necesitemos agrupar por row_number()
df1 %>%
group_by(rn=row_number()) %>%
do(data.frame(ID= .$ID, Date= seq(.$created_at,
as.Date(''2015-07-12''), by = ''1 day''), stringsAsFactors=FALSE))
Actualizar
Basado en el comentario de @ Frank, el nuevo modismo para tidyverse
es
library(tidyverse)
df1 %>%
group_by(ID) %>%
mutate(d = list(seq(created_at, as.Date(''2015-07-12''), by=''1 day'')), created_at = NULL) %>%
unnest()
En el caso de data.table
setDT(df1)[, list(date=seq(created_at,
as.Date(''2015-07-12''), by = ''1 day'')), by = 1:nrow(df1)]
datos
df1 <- structure(list(ID = c("MUM-0001", "MUM-0002", "MUM-0003",
"MUM-0004",
"MUM-0005", "MUM-0006"), created_at = structure(c(16176, 16084,
16177, 16172, 16178, 16177), class = "Date")), .Names = c("ID",
"created_at"), row.names = c(NA, -6L), class = "data.frame")
Tengo un conjunto de datos que se ve así:
ID created_at
MUM-0001 2014-04-16
MUM-0002 2014-01-14
MUM-0003 2014-04-17
MUM-0004 2014-04-12
MUM-0005 2014-04-18
MUM-0006 2014-04-17
Estoy intentando introducir una nueva columna que sea todas las fechas entre la fecha de inicio y la definida el último día (por ejemplo, 12 de julio de 2015). Utilicé la función seq en dplyr
pero dplyr
un error.
data1 <- data1 %>%
arrange(ID) %>%
group_by(ID) %>%
mutate(date = seq(as.Date(created_at), as.Date(''2015-07-12''), by= 1))
el error que estoy obteniendo es:
Error: tamaño incompatible (453), esperando 1 (el tamaño del grupo) o 1
¿Puede sugerir alguna mejor forma de realizar esta tarea en R?