Mi piacerebbe ottenere un elenco di tutti i titoli di tutti gli articoli di Wikipedia. So che ci sono due modi possibili per ottenere contenuti da una wiki di Wikimedia. Uno sarebbe l'API e l'altro sarebbe un dump del database.Come ottenere un elenco di titoli di tutti gli articoli di Wikipedia
Preferirei non scaricare il dump della wiki. innanzitutto perché è enorme, in secondo luogo perché non ho molta esperienza con l'interrogazione dei database. D'altro canto, il problema con l'API è che non riuscivo a trovare un modo per recuperare solo un elenco dei titoli degli articoli e anche se avrebbe avuto bisogno di> 4 milioni di richieste che probabilmente mi avrebbero comunque bloccato da ulteriori richieste. Quindi la mia domanda è 1. se esiste un modo per ottenere solo i titoli degli articoli di wikipedia tramite l'API e 2. se esiste un modo per combinare più richieste/query in una sola. O devo effettivamente scaricare un dump di Wikipedia?
Si potrebbe provare la [API Sandbox] (http://en.wikipedia.org/wiki/Special%3aApiSandbox#action=query&prop=extracts&format=json&exintro=&titles=Stack%20Overflow) o una [query] effettiva (http : //en.wikipedia.org/w/api.php? action = query & list = allpages & format = json) – chridam