Il mio obiettivo è prendere HTML immesso dall'utente finale, rimuovere determinati tag non sicuri come <script>
e aggiungerlo al documento. Qualcuno sa di una buona libreria Javascript per disinfettare l'html?È disponibile una buona libreria di analisi HTML basata su Javascript?
Ho cercato in giro e trovato un paio online, tra cui John Resig's HTML parser, Erik Arvidsson's simple html parser, e Google's Caja Sanitizer, ma non sono stato in grado di trovare molte informazioni sul fatto che le persone hanno avuto buone esperienze con queste librerie, e io sono preoccupato che non sono abbastanza robusti da gestire l'HTML arbitrario. Farei meglio a inviare l'HTML al mio server Java per la sanificazione?
Visto che è meglio disinfettare sul lato server, potrebbe non valerne la pena. A meno che il tuo disinfettante lato client non dia sempre gli stessi risultati del tuo lato server senza errori, probabilmente non ne vale la pena. –