Il documento che sto parsing ha le seguenti due stili di td
tag (tra le altre istanze di td
tag):selettori CSS per escludere dalla presenza attributo
<td align="right" nowrap bgcolor="#A1C87A">...</td>
<td align="right" nowrap>...</td>
Come faccio a scrivere un selettore che seleziona solo il secondo digita ed escludi tutti gli altri tag td
?
document.css('td:not([bgcolor="#A1C87A"])')
esclude il primo tipo, comprende il secondo tipo più tutti gli altri td
tag pure.
document.css('td[align="right"][nowrap]')
esclude tutti gli altri tag td
, ma include entrambi i tipi sopra.
Il passaggio 1 sarebbe quello di scrivere l'HTML corrente che non include gli attributi align e bgcolor. Prova invece CSS. – j08691
L'OP probabilmente non ha alcun controllo sull'HTML. Quale sarebbe il punto di analisi del codice HTML che controlli? –
@ the Tin Man: Quindi le persone possono muovere il dito contro di te e dirti cosa dovresti fare invece, ovviamente. – BoltClock