Qual è il modo migliore per convertire una stringa da Unicode in ASCII senza modificarne la lunghezza (che è molto importante nel mio caso)? Anche i personaggi senza problemi di conversione devono trovarsi nelle stesse posizioni della stringa originale. Quindi un "Ä" deve essere convertito in "A" e non qualcosa di criptico che ha più caratteri.Converti Unicode in ASCII senza modificare la lunghezza della stringa (in Java)
Modifica:
@novalis - Tali simboli (ad esempio delle lingue asiatiche) devono essere convertiti in alcuni segnaposto. Non sono troppo interessato a quelle parole o al loro significato.
@MtnViewMark - Devo conservare il numero di tutti i caratteri e la posizione dei caratteri ASCII disponibili in qualsiasi circostanza.
Ecco alcune informazioni in più: dispongo di strumenti di mining di testo che possono elaborare solo stringhe ASCII. La maggior parte del testo che deve essere elaborato è in inglese, ma alcuni contengono caratteri non ASCII. Non sono interessato a queste parole, ma devo essere sicuro che le parole che mi interessano (quelle che contengono solo caratteri ASCII) sono nelle stesse posizioni dopo la conversione delle stringhe.
Che cosa intendete convertire in 口水 雞? Non so come si possa esprimere il concetto di pollo saliva in tre caratteri ascii. – novalis
Non è chiaro: stai cercando di conservare il numero di caratteri o il numero di byte ... o forse la larghezza della stringa quando viene visualizzata? – MtnViewMark
@novalis +1 per il pollo saliva :-) –