Guardando attraverso i miei registri di ricerca di tanto in tanto, noto che il più grande utente del mio motore di ricerca è il google-bot. Cosa dà? Sta cercando contenuti che potrebbero non essere direttamente accessibili attraverso la navigazione? Se è così, come fa a sapere quali parole e frasi cercare (sono sorprendentemente rilevanti). Controlla le parole chiave più popolari sul sito? So che sembra che risponda alla mia domanda qui, ma in realtà funziona solo dai primi principi. Mi piacerebbe sentire da qualcuno che sa di cosa stanno parlando (io non sono io).Perché e in che modo googlebot utilizza il motore di ricerca del mio sito web?
risposta
Google utilizzerà le parole che si verificano sul tuo sito in caselle di ricerca per cercare di trovare le pagine che non può altrimenti.
Google dice che negli ultimi mesi, è stato la compilazione di moduli su un "piccolo numero" di siti web "di alta qualità" per tornare informazioni. Quali parole sta entrando in quelle forme? Parole selezionate automaticamente che si verificano sul sito, con le caselle di controllo e i menu a discesa anche selezionati. http://searchengineland.com/google-now-fills-out-forms-crawls-results-13760
Se il metodo del modulo di ricerca viene utilizzato al posto del post, ogni ricerca ha il proprio URL e le persone potrebbero pubblicare tali URL altrove. Oppure se hai una pagina webstats pubblicamente accessibile (possibilmente inavvertitamente) che elenca questi URL, questo è un altro modo comune per i motori di ricerca di imbattersi negli url di ricerca interni. Un terzo modo che ho visto sono i siti che elencano le ricerche recenti sulle loro pagine, ma questo è più intenzionale. "MySQL Performance Blog" lo fa in modo fastidioso, quindi qualsiasi ricerca del proprio sito da parte di google produce centinaia di pagine di ricerche simili, anche se nessuno di loro ha trovato quello che stavano cercando.
Edit: Sembra che lo fa in occasione, ma ottiene solo forme: http://googlewebmastercentral.blogspot.com/2008/04/crawling-through-html-forms.html
In realtà, questo è un buon punto. Il metodo del modulo di ricerca è GET in modo che lo staff e gli utenti possano aggiungere ai segnalibri le proprie ricerche. Ho ricontrollato le mie statistiche e sono protette da pw. Il fatto è che googlebot sta facendo le sue ricerche uniche; non compaiono da nessun'altra parte nei log. Curioso, eh? –
Solo curioso, che parole entra? –
Dovrebbe inserire termini che, se trovati altrove nel sito, o termini simili che ritiene possano essere applicati. –