2012-06-10 10 views
8

Ho una semplice domanda: qual è la differenza tra UTF-8, UTF-16 e UTF-32? So che le stringhe codificate hanno dimensioni diverse, ma quali sono le UTF-16 e UTF-32 per? Non dovrebbe UTF-8 essere in grado di gestire tutte le lingue correttamente? E come si inserisce UTF-7?Differenza tra le codifiche UTF?

EDIT

Ok, relativamente comprendere il lato tecnico di tutta la faccenda, ma io ancora non vedo un motivo per cui dovrei usare per esempio UTF-16 invece di UTF-8 nella mia app. Quindi la mia domanda è: qual è l'uso pratico di altre codifiche quindi UTF-8?

+1

Vorrei solo sapere qualche esempio pratico di UTF-32 diciamo. Ha qualche applicazione reale? –

risposta

2

Questo articolo dal famoso Joel Spolsky lo spiega perfctly: http://www.joelonsoftware.com/articles/Unicode.html

Citazione:

Ci sono centinaia di codifiche tradizionali in grado di memorizzare solo alcuni punti di codice in modo corretto e modificare tutti gli altri punti di codice in Punti interrogativi. Alcune codifiche popolari del testo inglese sono Windows-1252 (lo standard Windows 9x per le lingue dell'Europa occidentale) e ISO-8859-1, ovvero Latin-1 (utile anche per qualsiasi lingua dell'Europa occidentale). Ma prova a memorizzare lettere russe o ebraiche in queste codifiche e ottieni un sacco di punti interrogativi. UTF 7, 8, 16 e 32 hanno tutti la bella proprietà di poter memorizzare correttamente qualsiasi punto di codice.

0

Forse il Unicode FAQ sarebbe d'aiuto?

C'è una tabella di confronto che riassume alcune delle differenze.