So che questa domanda è stata posta molte volte ma voglio essere più specifica.come limitare l'indicizzazione del sito
Ho un dominio di sviluppo e ho spostato il sito in una sottocartella. Diciamo da:
http://www.example.com/
A:
http://www.example.com/backup
Quindi voglio la sottocartella di non essere indicizzati dai motori di ricerca a tutti. Ho inserito robots.txt con i seguenti contenuti nella sottocartella (posso inserirlo in una sottocartella o deve essere sempre alla radice, perché voglio che il contenuto della radice sia visibile ai motori di ricerca):
User-agent: *
Disallow:/
Forse ho bisogno di sostituirlo e mettere nella root il seguente:
User-agent: *
Disallow: /backup
l'altra cosa è, ho letto da qualche parte che alcuni robot non rispettano il file robots.txt così sarebbe solo mettendo un file .htaccess nella cartella/backup fa il lavoro?
Order deny,allow
Deny from all
Qualche idea?
+1 per spiegazione dettagliata, grazie anche per avermelo ricordato :) – Sarfraz
Nessun problema! Grazie :) – jmort253
Ciao grazie per il commento e ricordando la maggior parte delle cose. Una domanda però, ho bisogno di mettere un non consentire:/al sottodominio dev in modo che i file non sono indicizzati? Lo voglio solo sulla produzione ... anche per quanto riguarda il contenuto duplicato da quel sottodominio dev? –