Provo ad analizzare la pagina html e recuperare i valori per le valute e scrivere in csv. Ho seguente codice:Come analizzare la tabella html con python e beautifulsoup e scrivere in csv
#!/usr/bin/env python
import urllib2
from BeautifulSoup import BeautifulSoup
contenturl = "http://www.bank.gov.ua/control/en/curmetal/detail/currency?period=daily"
soup = BeautifulSoup(urllib2.urlopen(contenturl).read())
table = soup.find('div', attrs={'class': 'content'})
rows = table.findAll('tr')
for tr in rows:
cols = tr.findAll('td')
for td in cols:
text = td.find(text=True) + ';'
print text,
print
Il problema è che io non so, come recuperare solo i valori per la valuta. Ho provato alcune espressioni regolari come '^ [0-9] {3}' - inizia con 3 cifre ma non funziona.
Qualsiasi motivo si sta utilizzando BeautifulSoup 3 anziché 4? Non che sia importante per il tuo problema, ma bs4 offre funzionalità molto migliori nei luoghi. –
Stai cercando di ottenere solo i valori della colonna "tassi di cambio ufficiali"? – jurgenreza