2011-08-16 4 views
29

Alcuni lavori sono in corso relativi all'aggiunta del supporto xpath a jsoup https://github.com/jhy/jsoup/pull/80.jsoup supporta xpath?

  • Funziona?
  • Come posso usarlo?
+0

C'è una barca di informazioni su questo argomento là fuori: https://stackoverflow.com/questions/11816878/jsoup- css-selector-code-xpath-code-included https://stackoverflow.com/questions/16335820/convert-xpath-to-jsoup-query https://stackoverflow.com/questions/11791596/how-to-get- absolute-path-of-an-html-element https://groups.google.com/forum/?fromgroups#!topic/jsoup/lj4_-EJwH1Q –

risposta

11

JSoup non supporta XPath ancora, ma si può tentare XSoup-"Jsoup con XPath".

Ecco un esempio citato dal sito progetti Github (link):

@Test 
public void testSelect() { 

    String html = "<html><div><a href='https://github.com'>github.com</a></div>" + 
      "<table><tr><td>a</td><td>b</td></tr></table></html>"; 

    Document document = Jsoup.parse(html); 

    String result = Xsoup.compile("//a/@href").evaluate(document).get(); 
    Assert.assertEquals("https://github.com", result); 

    List<String> list = Xsoup.compile("//tr/td/text()").evaluate(document).list(); 
    Assert.assertEquals("a", list.get(0)); 
    Assert.assertEquals("b", list.get(1)); 
} 

Ci troverete anche una lista di caratteristiche e le espressioni di XPath che sono supportati da XSoup.

1
Non

ancora, ma il progetto ha JsoupXpath fare it.For esempio,

String xpath="//div[@id='post_list']/div[./div/div/span[@class='article_view']/a/num()>1000]/div/h3/allText()"; 
String doc = "..."; 
JXDocument jxDocument = new JXDocument(doc); 
List<Object> rs = jxDocument.sel(xpath); 
for (Object o:rs){ 
    if (o instanceof Element){ 
     int index = ((Element) o).siblingIndex(); 
     System.out.println(index); 
    } 
    System.out.println(o.toString()); 
}