sto cercando di prendere la seguente pagina web:Perché urllib.urlopen.read() non corrisponde al codice sorgente?
import urllib
urllib.urlopen("http://www.gallimard-jeunesse.fr/searchjeunesse/advanced/(order)/author?catalog[0]=1&SearchAction=1").read()
Il risultato non corrisponde a quello che vedo quando si ispeziona il codice sorgente della pagina web utilizzando Google Chrome per esempio.
Potrebbe dirmi perché questo succede e come posso migliorare il mio codice per superare il problema?
Grazie per il vostro aiuto.
Quali sono le differenze? –
Ciao, urllib.urlopen.read() mi dà per esempio nel corpo: '
\ n \ n' che è un'informazione troppo piccola riguardo a cosa c'è nella pagina. –Vedi la risposta di Srikar.La pagina è generata dinamicamente usando javascript. La chiave è in "Album1.EcritElement (0)". –