2011-08-21 17 views

risposta

7

L'unica possibilità è quella di recuperare tutte le revisioni e le considero. Potrebbe essere necessario continue the query per quello.

Bug 17993 significa includere un conteggio, ma è ancora non risolto.

1

Recuperare le revisioni e implementare un metodo per contarle (È solo XML).

MediaWiki Revisions: Example

api.php ? action=query & prop=revisions & titles=API|Main%20Page & rvprop=timestamp|user|comment|content 

.

<api> 
<query> 
<pages> 
    <page pageid="1191" ns="0" title="API"> 
    <revisions> 
     <rev user="Harryboyles" timestamp="2006-10-31T05:39:01Z" comment="revert unexplained change: see talk ..."> 
     ...content... 
     </rev> 
    </revisions> 
    </page> 
    <page pageid="11105676" ns="0" title="Main Page"> 
    <revisions> 
     <rev user="Ryan Postlethwaite" timestamp="2007-06-26T19:05:06Z" comment="rv - what was that for?"> 
     ...content... 
     </rev> 
    </revisions> 
    </page> 
</pages> 

+0

Questo è un modo molto costoso per ottenere il numero di revisioni. Stai richiedendo molti dati (contenuto della pagina, modifica dei riepiloghi) che stai semplicemente buttando via. – Mark

1

Ecco il codice per ottenere il numero di revisioni di una pagina (in questo caso, il JSON wiki page):

import requests 

BASE_URL = "http://en.wikipedia.org/w/api.php" 
TITLE = 'JSON' 

parameters = { 'action': 'query', 
      'format': 'json', 
      'continue': '', 
      'titles': TITLE, 
      'prop': 'revisions', 
      'rvprop': 'ids|userid', 
      'rvlimit': 'max'} 

wp_call = requests.get(BASE_URL, params=parameters) 
response = wp_call.json() 

total_revisions = 0 

while True: 
    wp_call = requests.get(BASE_URL, params=parameters) 
    response = wp_call.json() 

    for page_id in response['query']['pages']: 
    total_revisions += len(response['query']['pages'][page_id]['revisions']) 

    if 'continue' in response: 
    parameters['continue'] = response['continue']['continue'] 
    parameters['rvcontinue'] = response['continue']['rvcontinue'] 

    else: 
    break 

print parameters['titles'], total_revisions 

È possibile controllare il risultato qui: https://en.wikipedia.org/w/index.php?title=JSON&action=info#Edit_history

(accessibile dalla corrispondente barra laterale della pagina wikipedia: Strumenti - Informazioni sulla pagina)