2014-10-01 1 views
8

Nonostante le ricerche, non ho trovato una risposta definitiva a questo.Come impedire ad un'app di Heroku dall'indicizzazione di Google?

Ho 2 applicazioni in Heroku:

  • myapp-stagging.herokuapp.com
  • myapp-with-real-domain-name.com

Queste 2 applicazioni non hanno contenuti per ora (non sono indicizzati in Google)

Prima di spingere il contenuto verso di loro, vorrei essere sicuro che la mia app di stagging non sarà indicizzata in Google. Qual è il modo giusto per farlo? Non capisco perché la gente parla di robots.txt ma dove dovrei scrivere questo file?

Grazie.

PS: è COSI il sito StackExchange giusto a chiedere questo? Scusa se non.

risposta

2

Date un'occhiata per istruzioni complete qui - http://www.robotstxt.org/robotstxt.html

Funziona piace questo: un robot vuole visite qui un URL del sito Web, dire http://www.example.com/welcome.html. Prima lo fa, è primati controlli per http://www.example.com/robots.txt

Credo che vi darà un'idea di dove posizionare il file robots.txt

+1

Grazie per questo! Ma come gestire diversi ambienti con un file robots.txt su Heroku? C'è un modo per creare 2 file? O dovrei usare variabili d'ambiente in Heroku? http://stackoverflow.com/questions/11813534/different-robots-txt-for-staging-server-on-heroku -> questo sembra promettente :) –

+0

non capisco. cosa significa da diversi env con un robots.txt? la mia scommessa è che devi mettere su robot txt su staging e uno su app reale – Mysterion

+1

Heroku non funziona così. Hai gli stessi file per tutti i tuoi ambienti. Ma puoi trattare con env vars. Ho creato dynamic robots.txt secondo env var, sembra funzionare :) –