7

C'è una buona libreria/pacchetto per fare scraping web usando Scheme (preferibilmente Racket)?Web scraping con Schema

ad es. uno schema equivalente a mechanize?

+0

HTML valido (leggi XML) può essere facilmente analizzato in S-espressioni. – leppie

+0

Giusto, ma per quanto riguarda l'invio di moduli HTML, collegamenti di navigazione, ecc.? – abeln

+0

Sono sicuro che Racket ha alcune librerie http-client/client web. – leppie

risposta

7

Ho usato una combinazione della biblioteca Racket net/url, il html-parsing package, e SXML (soprattutto sxpath, per le query XPath). In realtà, ho scritto some wrappers su rete/url che lo rendono leggermente più facile da usare, IMO.

Quando ho avuto bisogno di gestire i cookie, ho chiamato il comando curl invece di usare net/url.