Voglio scrivere il mio web crawler in JS. Sto pensando di utilizzare una soluzione node.js come https://www.npmjs.com/package/js-crawlerCome mantenere attivo un crawler web?
L'obiettivo è avere una "scansione" ogni 10 minuti, quindi ogni 10 minuti desidero che il crawler recuperi i dati da un sito Web.
ho capito che avrei potuto scrivere un ciclo infinito come ad esempio:
var keeRunning = true;
while (keepRunning) {
// fetch data and process it every 10 minutes
}
Questo potrebbe funzionerà perfettamente bene se ho il mio computer in tutto il tempo e io sono sul sito.
Tuttavia, se spengo il computer, posso immaginare che non funzionerà più. Quindi, che tipo di soluzione dovrei considerare per mantenere uno script sempre attivo, anche quando il computer è spento?
Utilizza un server web, forse? –
Considerare la possibilità di creare un servizio gestito dal proprio sistema operativo – meskobalazs
@Tasos K. come funzionerebbe? Se scrivo una pagina che ha un ciclo while, viene eseguita solo quando visito la pagina. Come può funzionare anche quando non ci sono? – JohnAndrews