repetidas - seleccionar filas en r

Eliminar filas que contienen cadenas específicas en R (4)

Me gustaría excluir líneas que contengan una cadena "REVERSE", pero mis líneas no coinciden exactamente con la palabra, solo contuvela.

Mi marco de datos de entrada:

Value Name 55 REVERSE223 22 GENJJS 33 REVERSE456 44 GENJKI

Mi resultado esperado:

Value Name 22 GENJJS 44 GENJKI

En realidad, usaría:

df[ grep("REVERSE", df$Name, invert = TRUE) , ]

Esto evitará borrar todos los registros si la palabra de búsqueda deseada no está contenida en ninguna de las filas.

Esto debería funcionar:

df[- grep("REVERSE", df$Name),]

O una versión más segura sería:

df[!grepl("REVERSE", df$Name),]

Puede usar dplyr::filter() y negar una grepl() :

library(dplyr) df %>% filter(!grepl(''REVERSE'', Name))

O con dplyr::filter() y anulando una stringr::str_detect() :

library(stringr) df %>% filter(!str_detect(Name, ''REVERSE''))

Puede usar la función stringi paquete stringi

stri_detect_fixed(c("REVERSE223","GENJJS"),"REVERSE") [1] TRUE FALSE