2014-04-07 25 views
8

Voglio eseguire la ricerca per indicizzazione di 200 risultati per circa 2000 query ma mi dà un errore "limite giornaliero superato"."limite giornaliero superato" quando si utilizza l'API di ricerca personalizzata di Google

Voglio confermare quanti risultati possiamo eseguire la scansione al giorno. C'è qualche soluzione che può risolvere questo problema? O l'unico modo è quello di sottoporre a scansione una piccola parte di domande ogni giorno ...?

Il mio codice per eseguire la scansione di Google è la seguente:

def crawl(query_list): 
    http = httplib2.Http() 

    # Construct the service object for the interacting with the CustomSearch API. 
    service = discovery.build('customsearch', 'v1', developerKey='my api key', http=http) 

    res_list = [] 
    for query in query_list: 
     json_res = service.cse().list(q = query, cx = 'my search engine id', num = 200,).execute() 
     res_list.append(json_res) 

Grazie!

+0

Cosa dice la licenza? (hai accettato uno per ottenere la chiave dello sviluppatore) –

+0

scusate ma sono molto nuovo per google api ... dove posso vedere la licenza? So solo che utilizzo il "motore di ricerca personalizzato" gratuito anziché "ricerca su google site". Grazie! – yvetterowe

risposta

16

Secondo questa post:

I primi 100 query al giorno sono gratuiti. Più, quindi devi pagare $ 5 per 1000 query, per un massimo di 10.000 query al giorno, basta abilitare la fatturazione per farlo. Ogni query restituisce un massimo di 10 risultati, pertanto è possibile recuperare gratuitamente 1000 URL dalla ricerca al giorno per .