r performance packages levenshtein-distance stringdist

Levenshtein rápido distancia en R?



performance packages (3)

También puedes probar stringDist de Biostrings

¿Existe un paquete que contenga la función de conteo de distancias Levenshtein que se implemente como un código C o Fortran? Tengo muchas cadenas para comparar y stringMatch de MiscPsycho es demasiado lento para esto.


Y stringdist en el paquete stringdist también lo hace, incluso más rápido que levenshteinDist bajo ciertas condiciones ( 1 )


levenshteinDist (del paquete RecordLinkage ) llama al código C compilado. Darle una oportunidad.