E 'HTML valido da usare IRI contenenti caratteri non-ASCII come valori degli attributi (ad esempio per href
attributi) invece di URI? Ci sono differenze tra i sapori HTML (HTML e XHTML, 4 e 5)? Almeno RFC 3986 sembra implicare che non lo sia.Gli IRI sono validi come valori di attributo HTML?
Mi rendo conto che probabilmente sarebbe più sicuro (per quanto riguarda il software vecchio e IRI-inconsapevole) utilizzare la codifica percentuale, ma sto cercando una risposta definitiva per quanto riguarda lo standard.
Finora, ho eseguito alcuni test con il W3C validator e i caratteri Unicode senza escape negli URI non attivano alcun avviso o errore con HTML 4/5 e XHTML 4/5 doctypes (ma ovviamente l'assenza di errori i messaggi non implicano l'assenza di errori).
Almeno Chrome supporta anche cruda UTF-8 IRI, ma li cento-sfugge prima di sparare una richiesta HTTP. Inoltre, il mio server web (lighttpd) sembra supportare i caratteri UTF-8 nella loro percentuale codificati come pure in forma non codificata in una richiesta HTTP.
Attenzione che [Sezione 1.2 di RFC 3987] (http://tools.ietf.org/html/rfc3987#section-1.2) indica che HTTP come definito da [RFC 2616] (http: //tools.ietf. org/html/rfc2616) fa ** NOT ** per supportare gli IRI, quindi gestirli è al di fuori dello standard. Tu (o il tuo browser, o qualcuno) devi prima mappare un dato IRI a un URI prima di provare a recuperare la risorsa referenziata. – Oliver
possibile duplicato di [caratteri Unicode negli URL] (http://stackoverflow.com/questions/2742852/unicode-characters-in-urls) –