Esiste una libreria che rimuoverà le password "proprietario" dai documenti PDF in modo che il testo possa essere estratto a livello di codice da esse? Qualcosa come PDF Technologies' Password Recovery tool, ma richiamabile dalla riga di comando o da Python. Un'interfaccia GUI non mi è molto utile, dal momento che il numero di documenti è così grande.Esiste una libreria per rimuovere le password dai PDF a livello di programmazione?
Per favore, non ci sono commenti sulla legalità del processo. I PDF in questione sono di proprietà e il testo deve essere estratto per formare nuvole di parole chiave per il set di documenti.
Questo è perfetto, grazie. L'utilità della riga di comando funzionerà al meglio per me. –