C'è un modo per estrarre la prima lettera di una stringa codificata UTF-8 con Lua?Estrarre la prima lettera di una stringa UTF-8 con Lua
Lua non supporta correttamente Unicode, quindi string.sub("ÆØÅ", 2, 2)
restituirà "?"
anziché "Ø"
.
Esiste un algoritmo di analisi UTF-8 relativamente semplice che potrei utilizzare sul byte di stringa per byte, al solo scopo di ottenere la prima lettera della stringa, sia essa un carattere cinese o una A?
O è troppo complesso, che richiede una grande biblioteca, ecc?
"* semplice algoritmo di analisi Unicode *" Che * tipo * di "Unicode" è questo? È UTF-8, UTF-16, qualcos'altro? Qual è la codifica? –
http://www.joelonsoftware.com/articles/Unicode.html Leggi questo. Per favore. – Cubic
Ecco anche una [pagina per utenti Lua] (http://lua-users.org/wiki/LuaUnicode) –