Durante il tentativo di elaborare una risposta JSON con GSON (l'output proviene dall'API di flickr nel caso in cui lo si stia chiedendo) ho incontrato quello che descrivevo come una codifica piuttosto strana di alcuni caratteri speciali:GSON/JSON: problema speciale di char (umlaut)
Ecco una vista esadecimale di esso:
La 'U' seguito dal 'doppio-punti' è ciò che si suppone essere un tedesco ' ü ', e questo è dove la mia confusione inizia. È come se qualcuno prendesse il carattere e lo strappasse a metà, codificando ciascuno dei 2 pezzi. L'immagine seguente mostra la codifica esadecimale di quello che ci si aspetta che sia nel caso del 'ü' stato codificato correttamente:
Ancora più strano, nei casi in cui mi aspetterei problemi a verificarsi (cioè , il set di caratteri asiatici) tutto sembra funzionare bene, ad es "Title": "ナ ガ レ テ ユ ク · · ·"
Domande:
- è che alcune stranezza flickrAPI o la codifica JSON corretto per il reposonse? O è piuttosto codificato correttamente JSON ed è GSON che non riesce a "riassemblare" questa risposta nell'originale "ü". O l'autore del messaggio del titolo l'ha semplicemente fatto a pezzi?
- Come risolvo il problema (nel caso in cui sia JSON o GSON che sta facendo casino, non può ovviamente fare nulla se fosse l'autore). Come faccio a sapere quali "altri" caratteri sono interessati (mi vengono in mente, ma probabilmente ci sono più "casi speciali").
Il downlocoter può spiegare perché? –