2013-09-30 75 views
13

Ho un file txt di una conversazione esportata da WhatsApp. WhatsApp supporta le emoticon nella loro conversazione e anche la conversazione esportata contiene, con mia sorpresa, queste emoticon! Cioè, se apro il file di testo in un editor di testo (Text Wrangler su Mac 10.8) posso vedere le emoticon. Il file di testo è codificato in UTF-8 e non ci sono risorse associate al file che posso dire.caratteri speciali (emoticon) nel file di testo

Qualcuno può spiegarmi in che modo queste emoticon vengono incluse nel file di testo e in che modo vengono correttamente interpretate dall'editor di testo? Questo è collegato alla codifica del personaggio? Le risorse extra sono incluse nel file di testo?

risposta

21

Unicode contiene sezioni che specificano le emoji come "caratteri". Sono personaggi normali, hai solo bisogno di un font che possa visualizzarli. Vedi anche lo Unicode Emoji FAQ.

In un file di testo, i caratteri sono sostanzialmente codificati come numeri in forma di byte. Per visualizzarli visivamente sullo schermo di un computer è necessario un font contenente glifo per il rendering di questo carattere. Poiché il processo è sempre identificatore numerico → carattere → glifo visibile, dovrebbe essere abbastanza ovvio che un "personaggio" può essere qualsiasi cosa visiva, comprese le emoji o qualsiasi altra immagine.

character viewer

+1

Bella spiegazione. Aggiungerei che quando le emoticon sono codificate usando i codepoint standard Unicode, come U + 1F600, puoi usare qualsiasi carattere che li contenga. A volte vengono utilizzati i codepoint di uso privato e quindi è necessario un carattere molto specifico che abbia le emoticon in quei codepoint "concordati privatamente". –

+1

alcuni modi per migliorare questa risposta: 1) dove hai preso questo grafico? 2) esempio di come utilizzare questo grafico per inserire un emoji/simbolo – ahnbizcad