Ho trovato questo question che mi consente di verificare se una stringa contiene un carattere cinese. Non sono sicuro che gli intervalli di unicode siano corretti, ma sembrano tornare falsi per il giapponese e il coreano e veri per il cinese.Rileva se il carattere è semplificato o il carattere tradizionale cinese
Quello che non fa è dire se il personaggio è cinese tradizionale o semplificato. Come andresti a scoprirlo?
aggiornamento
D: Come posso riconoscere dal valore a 32 bit di un carattere Unicode se questo è un carattere cinese, coreano o giapponese?
http://unicode.org/faq/han_cjk.html
loro discussione che i personaggi indipendentemente dalla loro forma hanno lo stesso significato e pertanto devono essere rappresentati dallo stesso codice. Beh, non è privo di significato per me perché sto analizzando i singoli caratteri che non funziona con la loro soluzione:
Una soluzione migliore è quello di guardare al testo nel suo complesso: se c'è una discreta quantità di kana, è probabilmente giapponese, e se c'è una buona dose di hangul, probabilmente è coreano.
la codepage può aiutare a distinguere? Sembra che il cinese semplificato sia CP 936 e Traditional sia CP 950, almeno nel mondo Microsoft. Forse inizia da http://www.i18nguy.com/unicode/codepages.html per le tabelle codici MS e IBM. – rajah9
Ho fatto una rapida ricerca su google e ho trovato questo http://unicode.org/faq/han_cjk.html ho trovato alcune domande interessanti e hanno discusso anche dei personaggi tradizionali. Spero che sia d'aiuto! – Shaded
Le domande frequenti collegate a Shaded sembrano rispondere esattamente alla tua domanda. Come nell'esempio nelle note di collegamento, come stabiliresti se "chat" è l'inglese o il francese? Se non pensi che la tua risposta sia lì, potresti voler espandere la tua domanda un po '. – Thanatos