Ho bisogno di raschiare una pagina web usando Java e ho letto che la regex è un modo piuttosto inefficiente di farlo e uno dovrebbe metterlo in un documento DOM per spostarlo.Alcuni aiutano a scansionare una pagina in Java
Ho provato a leggere la documentazione ma sembra troppo estesa e non so da dove cominciare.
Potresti mostrarmi come raschiare la tabella this in una matrice? Posso provare a capire la mia strada da lì. Un esempio di snippet andrebbe benissimo.
Grazie.
Ho dato un'occhiata ai documenti di jSoup e sembra dannatamente buono. Stavo cercando qualcosa sulle linee di BeautifulSoup per Python ed eccolo qui! –