La mia stringa è Niệm Bồ Tát (Thiá»n sư Nhất Hạnh)
e voglio decodificarlo per Niệm Bồ Tát (Thiền sư Nhất Hạnh)
vedo in quel sito può farlo http://www.enderminh.com/minh/utf8-to-unicode-converter.aspxPython Come risolvere la codifica utf-8 rotta?
e comincio a provare da Python
mystr = '09. Bát Nhã Tâm Kinh'
mystr.decode('utf-8')
ma in realtà non è corretto perché la stringa originale è utf-8 ma la stringa show non è il mio risultato in attesa.
Nota: è un personaggio vietnamita.
Come risolvere il caso? È Windows Unicode o qualcosa del genere? Come rilevare la codifica qui. Grazie in anticipo
sembra che è stato codificato come 'utf-8', ma interpretata come' latino-1'. – ch3ka
'>>>" Niệm Bồ Tát (Thiền sư Nhất Hạnh) ". Codifica ('utf-8'). Decodifica ('latin-1')' ''Niá» \ x87m Bá »\ x93 Tát (Questo è molto vicino ... – ch3ka
@ ch3ka, in realtà cp1252, un superset di latin-1 –