C'è modo di verificare se il file di testo (.txt) è codificato con Unicode o UTF-8 con Java?C'è modo di verificare la codifica charset del file .txt con Java?
7
A
risposta
10
Non si può sapere con certezza assoluta quale charset è utilizzato nel caso generale. Ho trovato questa una buona lettura.
http://illegalargumentexception.blogspot.co.uk/2009/05/java-rough-guide-to-character-encoding.html
Soprattutto sezione rilevamento automatico della codifica.
2
Uhm, in teoria, come sapresti se è unicode?
Questa è la vera domanda. Sinceramente, non puoi saperlo, ma puoi fare un'ipotesi decente.
Vedere: Java : How to determine the correct charset encoding of a stream per ulteriori dettagli. :)