tablas studio seleccionar repetidos quitar eliminar duplicados duplicadas datos contar como columnas r duplicates dataframe

studio - seleccionar datos en r



Deshágase de las filas con atributos duplicados en R (2)

Si desea mantener una fila para cada ID, pero hay datos diferentes en cada fila, entonces debe decidir sobre alguna lógica para descartar las filas adicionales. Por ejemplo:

df <- data.frame(ID=c(1, 2, 2, 3), time=1:4, OS="Linux") df ID time OS 1 1 1 Linux 2 2 2 Linux 3 2 3 Linux 4 3 4 Linux

Ahora mantendré el valor de tiempo máximo y el último valor de sistema operativo:

library(plyr) unique(ddply(df, .(ID), function(x) data.frame(ID=x[,"ID"], time=max(x$time), OS=tail(x$OS,1)))) ID time OS 1 1 1 Linux 2 2 3 Linux 4 3 4 Linux

Tengo un gran marco de datos con columnas tales como:

ID, time, OS, IP

Cada fila de ese marco de datos corresponde a una entrada. Dentro de ese marco de datos para algunos ID existen varias entradas (filas). Me gustaría deshacerme de esas filas múltiples (obviamente, los otros atributos serán diferentes para la misma ID). O ponlo diferente: solo quiero una sola entrada (fila) para cada ID.

Cuando uso el unique en la columna ID, solo recibo los niveles (o cada ID única), pero también quiero mantener los otros atributos. He intentado usar apply(x,2,unique(data$ID)) , pero esto tampoco funciona.


subset(data,!duplicated(data$ID))

Debería hacer el truco