Ho trovato posti sul Web come http://www.chinesetopinyin.com/ che convertono caratteri cinesi in pinyin (romanizzazione). Qualcuno sa come fare questo o avere un database che può essere analizzato?Conversione da cinese a pinyin
MODIFICA: sto usando C# ma in realtà preferirei un database/flatfile.
.. e se si vuoi una rappresentazione solo ascii o numerica, potresti trovare come farlo nella documentazione, oppure puoi scegliere il primo pinyin e rimuovere gli accenti: http://stackoverflow.com/questions/517923/what-is-the-best- modo da rimuovere-accen ts-in-a-python-unicode-string – mykhal
Unicode ha una tabella per il mapping di Character to Pinyin, si chiama Unihan e ha un sacco di dati. :) – cburgmer
'raise ValueError, 'locale sconosciuto:% s'% localename ValueError: unknown locale: UTF-8' qualche idea? – jokoon