Sto usando sia il soundexing di Daitch-Mokotoff che Damerau-Levenshtein per scoprire se una voce utente e un valore nell'applicazione sono "uguali".Calcolo di una distanza relativa di Levenshtein - ha senso?
La distanza di Levenshtein dovrebbe essere utilizzata come valore assoluto? Se ho una parola di 20 lettere, una distanza di 4 non è così male. Se la parola ha 4 lettere ...
Quello che sto facendo ora è prendere la distanza/lunghezza per ottenere una distanza che rispecchi meglio la percentuale della parola è stata cambiata.
È un approccio valido/comprovato? O è semplicemente stupido?
Questo non è un approccio molto stupido, è stato utilizzato prima con un certo successo. Ci sono misure migliori, però. –
Quali sono quelli secondo te? –