Ho un indice ElasticSearch con circa 200 milioni di documenti, una dimensione totale dell'indice di 90 GB.Come reindex ElasticSearch rapidamente?
Ho modificato la mappatura, quindi vorrei che ElasticSearch indicizzasse nuovamente tutti i documenti.
Ho scritto uno script che crea un nuovo indice (con la nuova mappatura), quindi passa tutti i documenti nel vecchio indice e lo inserisce nel nuovo.
Sembra funzionare, ma il problema è che funziona estremamente lentamente. È iniziato con 300 documenti/minuto due giorni fa, e ora la velocità è di 150 documenti/minuto.
lo script viene eseguito su un computer all'interno della stessa rete le macchine di ricerca elastiche in.
Con tale velocità sarà necessario un mese per la ri-index per terminare.
Qualcuno conosce una tecnica più veloce per reindicizzare un indice di ricerca elastico?
Grazie Karmi! Avete qualche approssimazione su quale dovrebbe essere il tempo previsto per fare una tale operazione su un indice di 90 Gb (documenti 200 M)? – diemacht
Dipende se si può paralizzare l'operazione o meno. Elasticsearch può gestire un carico di scrittura piuttosto elevato, ma lo script di reindicizzazione è solitamente il collo di bottiglia. Prova a reindicizzare solo la parte dei dati ed estrapola - le prestazioni dell'API di scansione/scorrimento non dovrebbero "decadere" nel tempo. – karmi
Sembra che Tyre sia stato deprecato. Elastic ora elenca i clienti consigliati qui: https://github.com/elastic/elasticsearch-rails – spuder