Vorrei qualche consiglio su come creare e visualizzare una mappa dei collegamenti tra i blog in modo da riflettere il "social network" tra loro.Mappare la rete di collegamento tra blog usando R?
Ecco come sto pensando di farlo:
- Inizia con uno (o più) blog home page e raccogliere tutti i link a quella pagina
- rimuovere tutti i link che sono link interni (Cioè, se parto da www.website.com, allora voglio rimuovere tutti i link dalla forma "www.website.com/***"). Ma conserva tutti i link esterni.
- Andare a ciascuno di questi collegamenti (supponendo che non li abbia già visitati) e ripetere il passaggio 1.
- Continuare fino a quando (diciamo) X salta dalla prima pagina.
- Tracciare i dati raccolti.
immagino che per fare questo in R, si potrebbe usare RCurl/XML (Grazie per la risposta Shane here), in combinazione con qualcosa come IGRAPH.
Ma dal momento che non ho esperienza con nessuno di loro, c'è qualcuno qui che potrebbe essere disposto a correggermi se ho saltato qualche passaggio importante, o allego qualche utile snippet di codice per consentire questo compito?
ps: La mia motivazione per questa domanda è che in una settimana mi sto dando una conferenza su 2010 dell'utente su "blogging e R", e ho pensato che questo potrebbe essere un bel modo per entrambi dare qualcosa di divertente per il pubblico e anche motivarli a fare qualcosa di simile loro stessi
Grazie mille!
Tal
Molte grazie Drew, ci provo (spero che lo farò funzionare in tempo). –