Ho due tabelle che ho bisogno di unire insieme in PostgreSQL, sulla variabile comune "nome della società". Sfortunatamente molti nomi di società non corrispondono esattamente (MICROSOFT in una tabella, MICROSFT nell'altra). Ho provato a rimuovere le parole comuni da entrambe le colonne come "corporation" o "inc" o "ltd" per cercare di standardizzare i nomi su entrambe le tabelle, ma ho difficoltà a pensare a strategie aggiuntive. Qualche idea?Corrispondenze di stringhe indistinte
Grazie.
Inoltre, se necessario, posso fare questo in R.
Considerate anche pg_trgm, ho avuto molto successo con esso negli scenari di deduplicazione. – maniek