Sto cercando di analizzare una pagina web e ottenere alcune informazioni con BeautifulSoup.findAll ma non li fa trovare .. Sto usando python3Beautiful Soup findAll non trova tutti
il codice è questo
#!/usr/bin/python3
from bs4 import BeautifulSoup
from urllib.request import urlopen
page = urlopen ("http://mangafox.me/directory/")
# print (page.read())
soup = BeautifulSoup (page.read())
manga_img = soup.findAll ('a', {'class' : 'manga_img'}, limit=None)
for manga in manga_img:
print (manga['href'])
esso stampa solo la metà di loro ...
grazie! quello ha funzionato! :) – Clepto
Wow. Questo mi ha salvato dal battere la testa di più sul tavolo. Come facevi a sapere che il parser lxml stava avendo problemi (a parte l'ovvio che stava solo restituendo 18 righe). cioè, come avrei dovuto sapere che si trattava di un problema diverso dal fatto che avesse silenziosamente il numero sbagliato di righe? – FuriousGeorge
Esperienza; principalmente aiutando le persone qui su SO. –