style link htmloutput r transliteration

link - Convertir personajes acentuados en caracteres ascii



tags$style shiny (2)

¿Cuál es la manera óptima de eliminar los acentos alemanes (o franceses) de un vector de 16 millones de variables de cadena?

por ejemplo, ''síndrome de Sjögren'' en ''síndrome de Sjögren''

La conversión de un solo carácter en un solo carácter es mejor que la transliteración como

ä => ae ö => oe ü => ue.

por ejemplo, usar una expresión regular sería una opción pero ¿hay algo mejor (paquete R para esto)?

gsub(''ü'',''u'',gsub(''ö'',''o'',"Sjögren''s syndrome ( über) "))

Existen soluciones SO para plataformas no R, pero no una buena para R.


Una de las respuestas enlazadas sugiere

library(stringi) stri_trans_general("Zażółć gęślą jaźń", "Latin-ASCII") [1] "Zazolc gesla jazn"


Use iconv para convertir a ASCII con transliteración (si es compatible):

iconv(c("über","Sjögren''s"),to="ASCII//TRANSLIT") [1] "uber" "Sjogren''s"