Esiste una durata temporale standard che un crawler deve attendere tra una serie di hit ripetuti sullo stesso server, in modo da non sovraccaricare il server.Qual è la durata ottimale per un web crawler di attendere tra richieste ripetute su un server web
In caso contrario, qualsiasi suggerimento su cosa può essere un buon periodo di attesa per il crawler per essere considerato educato.
Questo valore varia anche da server a server ... e in tal caso come si può determinarlo?
Grazie per le risposte rapide ragazzi ... attualmente la mia prima preoccupazione non è quella di colpire i server web troppo velocemente ... ogni suggerimento a riguardo sarà fantastico! –
Hai dimenticato di menzionare ... sto colpendo URL diversi dallo stesso dominio ogni volta ... cercando di capire l'intervallo ottimale tra tali richieste –