repetidas - seleccionar filas en r
Eliminar filas que contienen cadenas específicas en R (4)
Me gustaría excluir líneas que contengan una cadena "REVERSE", pero mis líneas no coinciden exactamente con la palabra, solo contuvela.
Mi marco de datos de entrada:
Value Name
55 REVERSE223
22 GENJJS
33 REVERSE456
44 GENJKI
Mi resultado esperado:
Value Name
22 GENJJS
44 GENJKI
En realidad, usaría:
df[ grep("REVERSE", df$Name, invert = TRUE) , ]
Esto evitará borrar todos los registros si la palabra de búsqueda deseada no está contenida en ninguna de las filas.
Esto debería funcionar:
df[- grep("REVERSE", df$Name),]
O una versión más segura sería:
df[!grepl("REVERSE", df$Name),]
Puede usar dplyr::filter()
y negar una grepl()
:
library(dplyr)
df %>%
filter(!grepl(''REVERSE'', Name))
O con dplyr::filter()
y anulando una stringr::str_detect()
:
library(stringr)
df %>%
filter(!str_detect(Name, ''REVERSE''))
Puede usar la función stringi
paquete stringi
stri_detect_fixed(c("REVERSE223","GENJJS"),"REVERSE")
[1] TRUE FALSE