Levenshtein rápido distancia en R?
performance packages (3)
También puedes probar stringDist
de Biostrings
¿Existe un paquete que contenga la función de conteo de distancias Levenshtein que se implemente como un código C o Fortran? Tengo muchas cadenas para comparar y stringMatch
de MiscPsycho
es demasiado lento para esto.
Y stringdist
en el paquete stringdist
también lo hace, incluso más rápido que levenshteinDist
bajo ciertas condiciones ( 1 )
levenshteinDist (del paquete RecordLinkage
) llama al código C compilado. Darle una oportunidad.