2012-11-07 20 views
29

Ho cercato su google (beh, DuckDuckGo'ed, in realtà) finché non sono blu in faccia, ma non riesco a trovare un elenco di codici lingua del tipo en-GB o fr-CA ovunque.Dove posso trovare un elenco di codici lingua + regione?

Ci sono risorse eccellenti sui componenti, in particolare lo W3C I18n page, ma speravo in un semplice elenco alfabetico, se possibile abbastanza canonico (qualcosa come this one). Non può trovare.

Qualcuno può indicarmi la giusta direzione? Grazie molto!

+0

Il link che hai fornito * è * il registro ufficiale. Cosa manca a quel documento? –

+0

@ jorg-w-mittag: potrebbe essere ingenuo, ma speravo in un elenco abbastanza completo delle combinazioni comuni di quel tipo, non semplicemente dei sotto-tag isolati. –

+3

L'elenco più accurato che ho trovato è [questo] (https://msdn.microsoft.com/en-us/library/ee825488%28v=cs.20%29.aspx?f=255&MSPPError=-2147217396) –

risposta

34

Esistono diversi sistemi di codici lingua e diversi sistemi di codici regionali, nonché le loro combinazioni. Quando si fa riferimento a una pagina W3C, presumo che si stia facendo riferimento al sistema definito in BCP 47. Questo sistema è ortogonale nel senso che i codici come en-GB e fr-CA combinano semplicemente un codice di lingua e un codice di regione. Questo significa un numero molto grande di possibili combinazioni, la maggior parte delle quali ha poco senso, come ab-AX, che significa Abkhaz come parlato in Åland (non credo che nessuno, e ancor meno una comunità, parli di Abkhaz lì, sebbene sia teoricamente possibile ovviamente).

Quindi qualsiasi elenco di combinazioni di lingue e regioni sarebbe solo un elenco pragmatico di combinazioni che sono importanti in un certo senso o supportate da alcuni software in un senso speciale.

Le specifiche che hai trovato definiscono i principi generali e anche le fonti autorevoli su diversi "sottotag" (come il codice della lingua principale e il codice della regione). Per le parti più importanti, l'autorità di registrazione ufficiale mantiene lo three- and two-letter ISO 639 codes per le lingue e il sito ISO contiene lo two-letter ISO 3166 codes per le regioni. Gli elenchi sono abbastanza leggibili e non vedo alcun motivo per considerare l'utilizzo di risorse diverse da quelle principali, in particolare per quanto riguarda le possibili modifiche.

+1

Grazie per la spiegazione completa: hai capito chiaramente la mia domanda e ti ho spiegato perché probabilmente non troverei la risposta che speravo! Questo è bello sapere. –

+0

Sarebbe davvero bello avere una lista canonica di combinazioni che abbia senso per quelli di noi che non sanno nemmeno cosa siano Abkhaz e Åland. Peccato che questo non esiste. – melinath

+0

Possono essere leggibili, ma sono anche insufficienti per molte esigenze di codifica della lingua. Personalmente spero che la lista delle lingue in sviluppo su glottolog.org diventi un nuovo standard ... – pat

6

Ci sono 2 componenti in gioco qui:

  1. Il tag lingua che è generalmente definita da ISO 639-1 alpha-2
  2. Il tag regione che è generalmente definita da ISO 3166-1 alpha-2

È possibile combinare lingue e regioni in qualsiasi combinazione abbia senso per te, quindi non esiste un elenco di tutte le possibilità.

BTW, si sta effettivamente utilizzando uno BCP47 tag, che definisce gli standard per ogni segmento di locale.

+0

"... non c'è una lista di tutte le possibilità." Più o meno quello che ho elaborato, e questo è il riassunto "esecutivo" della spiegazione più completa di Jukka, suppongo. Ancora mi sembra che una lista delle combinazioni * comuni * possa essere una cosa utile da avere a disposizione, ma OTOH, sembra che potrei essere un po 'isolato nel sentirmi in quel modo! :) –