ruby
  • nokogiri
  • hpricot
  • 2009-10-12 7 views 23 likes 
    23

    Dato:Come faccio una ricerca regolare in Nokogiri per il testo che corrisponde ad un certo inizio?

    require 'rubygems' 
    require 'nokogiri' 
    value = Nokogiri::HTML.parse(<<-HTML_END) 
    "<html> 
    <body> 
        <p id='para-1'>A</p> 
        <div class='block' id='X1'> 
        <h1>Foo</h1> 
        <p id='para-2'>B</p> 
        </div> 
        <p id='para-3'>C</p> 
        <h2>Bar</h2> 
        <p id='para-4'>D</p> 
        <p id='para-5'>E</p> 
        <div class='block' id='X2'> 
        <p id='para-6'>F</p> 
        </div> 
    </body> 
    </html>" 
    HTML_END 
    

    voglio fare qualcosa di simile a quello che posso fare in Hpricot:

    divs = value.search('//div[@id^="para-"]') 
    
    1. Come faccio a fare una ricerca modello per elementi in stile XPath?
    2. Dove trovo la documentazione per aiutarmi? Non l'ho visto negli rdoc.
    +0

    PSA: Per coloro che tentano regex più complesso, questo è probabile che quello che stai cercando: http://stackoverflow.com/questions/649963/ nokogiri-searching-for-div-using-xpath – DreadPirateShawn

    risposta

    64

    utilizzare la funzione XPath starts-with:

    value.xpath('//p[starts-with(@id, "para-")]').each { |x| puts x['id'] } 
    
    +29

    Wow, lo stesso Aaron ha risposto! – khelll

    +1

    @khelll cosa c'è di bello in Aaron? –

    +5

    Autore del membro principale del team Nokogiri e RoR. – khelll

    2

    E alcuni documenti che state cercando:

    16
    divs = value.css('div[id^="para-"]') 
    
    +0

    questo è un risparmiatore di vita – Onichan

    1
    Nokogiri::XML::Node.send(:define_method, 'xpath_regex') { |*args| 
        xpath = args[0] 
        rgxp = /\/([a-z]+)\[@([a-z\-]+)~=\/(.*?)\/\]/ 
        xpath.gsub!(rgxp) { |s| m = s.match(rgxp); "/#{m[1]}[regex(.,'#{m[2]}','#{m[3]}')]" } 
        self.xpath(xpath, Class.new { 
        def regex node_set, attr, regex 
         node_set.find_all { |node| node[attr] =~ /#{regex}/ } 
        end 
        }.new) 
    } 
    

    Usage:

    divs = Nokogiri::HTML(page.root.to_html). 
        xpath_regex("//div[@class~=/axtarget$/]//div[@class~=/^carbo/]") 
    

     Problemi correlati

    • Nessun problema correlato^_^