studio mtext ggplot change r regex string bioinformatics biomart

mtext - plotly title r



Retire parte de la cadena después de "." (3)

Podemos simular que son nombres de archivo y eliminar extensiones :

tools::file_path_sans_ext(a) # [1] "NM_020506" "NM_020519" "NM_001030297" "NM_010281" "NM_011419" "NM_053155"

Estoy trabajando con los números de acceso a la secuencia de referencia NCBI como la variable a :

a <- c("NM_020506.1","NM_020519.1","NM_001030297.2","NM_010281.2","NM_011419.3", "NM_053155.2")

Para obtener información del paquete biomart, necesito eliminar .1 , .2 , etc. después de los números de acceso. Normalmente hago esto con este código:

b <- sub("..*", "", a) # [1] "" "" "" "" "" ""

Pero como puede ver, esta no es la forma correcta para esta variable. Puede alguien ayudarme con esto?


Podrías hacerlo:

sub("*//.[0-9]", "", a)

o

library(stringr) str_sub(a, start=1, end=-3)


Solo necesitas escapar del período:

a <- c("NM_020506.1","NM_020519.1","NM_001030297.2","NM_010281.2","NM_011419.3", "NM_053155.2") gsub("//..*","",a) [1] "NM_020506" "NM_020519" "NM_001030297" "NM_010281" "NM_011419" "NM_053155"