Sto usando il Python requests lib per ottenere un file PDF dal web. Funziona bene, ma ora voglio anche il nome file originale. Se vado in un file PDF in Firefox e clicco su download
, ha già un nome file definito per salvare il pdf. Come ottengo questo nome file?Come ottenere il nome file pdf con richieste Python?
Ad esempio:
import requests
r = requests.get('http://www.researchgate.net/profile/M_Gotic/publication/260197848_Mater_Sci_Eng_B47_%281997%29_33/links/0c9605301e48beda0f000000.pdf')
print r.headers['content-type'] # prints 'application/pdf'
Ho controllato il r.headers
per qualcosa di interessante, ma non c'è il nome del file in là. In realtà speravo in qualcosa come r.filename
..
Qualcuno sa come posso ottenere il nome file di un file PDF scaricato con la libreria delle richieste?
Interessante - Stavo per dire "beh * ovviamente *' 0c9605301e48beda0f000000.pdf' "(come è nella richiesta) ma per fortuna ho deciso di testarlo prima. E FireFox vuole salvarlo come "Mater Sci Eng B47 (1997) 33.pdf". – usr2564301
Come stai controllando le intestazioni? Il nome file _è lì, 'content-disposition: inline; filename = "Mater Sci Eng B47 (1997) 33.pdf" '. FWIW, molti PDF hanno un [Titolo] (http://stackoverflow.com/q/6367304/4014959) incorporato in essi, ma non tutti, e potrebbe non essere facile da accedere se il PDF è in formato binario. –