2010-07-05 5 views
21

Esiste un pacchetto che contiene la funzione di conteggio della distanza Levenshtein implementata come codice C o Fortran? Ho molte stringhe per confrontare e stringMatch da MiscPsycho è troppo lento per questo.Fast Levenshtein distanza in R?

risposta

16

levenshteinDist (dal pacchetto RecordLinkage) chiamate codice C compilato. Provaci.

5

Si potrebbe provare stringDist da Biostrings così

12

E stringdist nel pacchetto stringdist non troppo, anche più veloce di levenshteinDist in determinate condizioni (1)

+0

stringdist ha accelerato in modo significativo dal quel blog si collega a : ora utilizza più core. –