Attualmente, ho una famiglia di colonne cassandra con grandi file di dati, per dire più di 100.000. Ora, vorrei rimuovere tutti i dati in questa famiglia di colonne e il problema è venuto fuori:La query di ricerca Cassandra è piuttosto lenta dopo aver eliminato un grande fascio di dati
Dopo che tutti i dati sono stati rimossi, eseguo una query di ricerca in questa famiglia di colonne, la cassandra impiegherà decine di secondi a ritornare un risultato di query vuoto. E il costo di tempo aumenta linearmente quando i dati originali è più grande
E 'causata dalla funzione lapide durante l'eliminazione dei dati dal database cassandra. La velocità di ricerca non riprenderà a funzionare normalmente fino a quando non viene attivato il prossimo GC. Vedi Cassandra Distributed Deletes.
Poiché tali operazioni di query sono spesso utilizzate nel mio sistema, non posso sopportare l'enorme latenza fino a pochi secondi.
Per favore, potresti darmi una soluzione a questo problema?
Forse usa [modello serie storica] (https://academy.datastax.com/resources/getting-started-time-series-data-mode ling) può essere un buon approccio? – deFreitas