2013-05-08 12 views
7

Le mie pagine HTML utilizzano <meta charset="windows-1252">.meta charset windows-1252 vs UTF-8

  1. Si sta passando a UTF-8 e perché?
  2. Ho controllato alcune delle mie pagine con UTF-8 e ottenuto punti interrogativi con alcuni simboli matematici. E.G: x dovrebbe essere cambiato in × per mostrare correttamente. Ho provato il CpConverter ma non ha convertito bene tutti i simboli.

C'è un modo migliore per convertire molti file?

+0

UTF-8 visualizzerà correttamente il mio nome, quindi dico di andare :) –

+0

E hai evitato correttamente la variante 'text/html' più lunga (http://stackoverflow.com/questions/4696499/meta-charset- utf-8-vs-meta-http-equiv-content-type) –

risposta

10
  1. UTF-8 è generalmente standard approvato, che funziona ovunque. Windows: qualsiasi codifica è specifica per Windows e non è garantito il funzionamento su alcuna macchina. Inoltre, dai un'occhiata a here e here
  2. Se vuoi cambiare la codifica di un file, puoi farlo in molti modi. È possibile cercare i tipo di codifica nel vostro editor di testo/IDE o utilizzare il seguente comando (non testato, dovrebbe funzionare comunque):

iconv -f WINDOWS-1252 -t UTF-8 filename.txt

+0

Does iconv funziona solo sulla macchina Linux? – Joe

+0

Ho paura si. Puoi sempre usare il blocco note - File-> Salva come-> Codifica-> UTF-8 – Mateusz

+0

Siamo spiacenti, c'è anche una traduzione di Windows - dai uno sguardo [qui] (http://dbaportal.eu/2012/10/24/ iconv-per-windows /). – Mateusz

0

Si tratta di una vecchia questione, ma la mia risposta potrebbe aiutare qualcuno a decidere meglio.

passando da Windows 1252 a UTF-8 circa raddoppia la dimensione dei file HTML.

se si desidera verificare questo, basta creare un file in blocco note con i seguenti caratteri Unicode:

الف

Salva una volta con la codifica ASCII e ancora una volta con la codifica UTF-8.

dimensione del file UTF-8: 9 byte

dimensione del file ASCII: 3 byte

se si desidera cambiare il set di caratteri della pagina, è sufficiente aprire in blocco note o qualsiasi altro editor e salvare come con la codifica UTF-8.