Sto scrivendo un programma che funziona con i documenti in Perl e molti dei documenti hanno caratteri come ä, ö, ü, é, etc
(sia maiuscolo che minuscolo). Mi piacerebbe sostituirli con le controparti ASCII a, o, u, e, etc
. Come lo farei in Perl?Come convertire le lettere con accenti, dieresi, ecc. Nelle loro controparti ASCII in Perl?
Una delle soluzioni che ho pensato è di avere un hash con le chiavi che sono i caratteri di umlaut e accento, ei valori sono controparti ASCII, ma ciò richiede che io abbia una lista di tutti i caratteri di umlaut e accento, che io indosso Ho, e se ho costruito una lista, sicuramente mi mancherebbero molti perché non conosco tutti i possibili personaggi che potrebbero avere umlaut, accenti e altri segni diacritici.
Provare a rimuovere gli accenti è quasi sempre la cosa sbagliata da fare. Immagino che tu voglia: [Come abbinare la stringa con diacritic in perl?] (Http://stackoverflow.com/q/7429964) – daxim
In caso contrario: [Come posso sostituire i caratteri Unicode con ASCII in Perl?] (Http: //stackoverflow.com/q/2309215) [Come posso modificare i caratteri latini estesi ai loro equivalenti ASCII non accentati?] (http://stackoverflow.com/q/450026) – daxim
Penso che il primo paragrafo di Testo :: Unidecode la descrizione del modulo definisce abbastanza bene i potenziali casi d'uso.) Non si tratta solo di regole di confronto. – raina77ow