Esiste un pacchetto che contiene la funzione di conteggio della distanza Levenshtein implementata come codice C o Fortran? Ho molte stringhe per confrontare e stringMatch
da MiscPsycho
è troppo lento per questo.Fast Levenshtein distanza in R?
21
A
risposta
16
levenshteinDist (dal pacchetto RecordLinkage
) chiamate codice C compilato. Provaci.
5
Si potrebbe provare stringDist
da Biostrings
così
12
E stringdist
nel pacchetto stringdist
non troppo, anche più veloce di levenshteinDist
in determinate condizioni (1)
stringdist ha accelerato in modo significativo dal quel blog si collega a : ora utilizza più core. –