Sto cercando modi per evitare l'indicizzazione di parti di una pagina. In particolare, i commenti su una pagina, poiché pesano molto le voci in base a ciò che gli utenti hanno scritto. Questo fa sì che una ricerca su Google restituisca molte pagine irrilevanti.Metodi per impedire ai motori di ricerca di indicizzare contenuto irrilevante su una pagina
Qui ci sono le opzioni che sto considerando finora:
1) commenti di carico utilizzando JavaScript per evitare che i motori di ricerca di vederli.
2) Utilizzare lo user agent per sniffare semplicemente non generare commenti per i crawler.
3) Utilizzare markup specifico del motore di ricerca per nascondere parti della pagina. Questa soluzione sembra alquanto stravagante, comunque. Presumibilmente, questo può essere fatto per prevenire Yahoo! indicizzazione del contenuto specifico:
<div class="robots-nocontent">
This content will not be indexed!
</div>
Quale è un modo molto brutto per farlo. Ho letto di una soluzione di Google che sembra migliore, ma credo che funziona solo con Google Search Appliance (qualcuno può confermare?):
<!--googleoff: all-->
This content will not be indexed!
<!--googleon: all-->
Qualcuno ha altri metodi di raccomandare? Quale dei tre sopra sarebbe il miglior modo per andare? Personalmente, mi sto orientando verso il n. 2 poiché, mentre potrebbe non funzionare per tutti i motori di ricerca, è facile scegliere i più grandi. E non ha effetti collaterali sugli utenti, a meno che non stiano deliberatamente cercando di impersonare un web crawler.
Che ne dici di visualizzare i tuoi commenti in un iframe (essenzialmente un'altra pagina in totale)? –
Potrebbe funzionare, se quella pagina viene specificata come non indicizzata dai motori di ricerca ... Ma sembra un modo molto rotondo per farlo ... Non sono mai stato un fan degli iframe. – Blixt
"In questo modo una ricerca su Google nella pagina restituisce molte pagine non pertinenti." Cosa intendi con "Ricerca Google sulla pagina"? La pagina dovrebbe essere visualizzata nei risultati di Google quando corrisponde alla query di ricerca: sei preoccupato che la pagina venga visualizzata troppo spesso? –