Se si sta lavorando su un grande insieme di dati e sono a posto con una buona approssimazione, mi consiglia di utilizzare il comando:
nodetool --host <hostname> cfstats
Questo dump di una lista per ogni famiglia colonna di simile a questo:
Column Family: widgets
SSTable count: 11
Space used (live): 4295810363
Space used (total): 4295810363
Number of Keys (estimate): 9709824
Memtable Columns Count: 99008
Memtable Data Size: 150297312
Memtable Switch Count: 434
Read Count: 9716802
Read Latency: 0.036 ms.
Write Count: 9716806
Write Latency: 0.024 ms.
Pending Tasks: 0
Bloom Filter False Postives: 10428
Bloom Filter False Ratio: 1.00000
Bloom Filter Space Used: 18216448
Compacted row minimum size: 771
Compacted row maximum size:
Compacted row mean size: 1634
Il "Numero di tasti (stima)" Row è una buona congettura all'interno del cluster e la performance è molto più veloce di esplicito contare gli approcci.
fonte
2013-01-21 21:04:19
Che chiaramente non scala, poiché ad un certo punto l'hash non si adatta più (utilmente) alla ram di PHP. Cassandra è per cose scalabili. – MarkR
Lo so - questo è ciò che mi preoccupa. Sono ancora in fase di sviluppo e sto cercando una soluzione migliore per problemi come questo. –