2011-01-13 8 views
5

Abbiamo utilizzato Cassandra 0.6 e ora abbiamo famiglie di colonne con milioni di chiavi. Siamo interessati a utilizzare la nuova funzionalità di indice secondario disponibile in 0.7 ma non è stata trovata alcuna documentazione su come il nuovo indice è memorizzato.Come vengono memorizzati gli indici secondari 0,7 di Cassandra?

C'è qualche limite di spazio su disco o l'indice è memorizzato in modo simile alle chiavi in ​​quanto è distribuito su più nodi?

Ho provato a sfogliare il sito di Cassandra per una risposta, ma senza risultati.

risposta

6

Gli indici secondari vengono memorizzati come famiglie di colonne non accessibili dall'utente. La loro dimensione sarà circa essere:

(cardinalità dell'insieme di valori indicizzati * la dimensione media dei valori di indice) + (il numero di chiavi nella famiglia colonna indicizzata * la dimensione media dei tasti nella famiglia colonna).

I nodi indicano solo le righe memorizzate localmente, ovvero solo le righe per le quali sono una replica.

+0

Ciao Tyler Hobbs, questo è un post molto interessante e informativo. Si parla di "Gli indici sono archiviati come CF": Ciò significa che TUTTI gli indici sono memorizzati sotto UNA nuova CF o questo significa che OGNI indice è memorizzato come il proprio CF (con una singola riga). Grazie!! – Markus

+1

Ogni indice è memorizzato come propria CF. –

+0

è memorizzato nella directory dei dati? Voglio dire posso vedere la differenza di dimensioni? – samarth