Ho il seguente comando per sostituire i caratteri Unicode con quelli ASCII.Come sostituire i caratteri Unicode con ASCII
sed -i 's/Ã/A/g'
Il problema è Ã
non viene riconosciuto dal comando sed nel mio ambiente Unix così mi piacerebbe pensare di sostituirlo con il suo valore esadecimale. Come sarebbe la sintassi se dovessi utilizzare C3
?
sto usando questo comando come un modello per gli altri personaggi che mi piacerebbe sostituire con spazi vuoti come:
sed -i 's/©// g'
intendi in questo modo? http://stackoverflow.com/questions/22450563/sed-matching-unicode-blocks-with – Leo
Quale set di caratteri utilizza il terminale? E quale codifica usa il testo di input? Ã in UTF-8 è 0xC3 0x83 e il carattere 0x83 è un codice di controllo in ISO 8859-1, quindi potrebbe essere un problema. Suppongo che tu non possa semplicemente impostare 'LANG = en_US.UTF-8' sul tuo sistema. – yellowantphil
"sed" farà il lavoro. Per favore vedi la mia risposta. – ajaaskel