2016-02-29 40 views
5

Desidero trasmettere i dati da una tabella cassandra che viene aggiornata in tempo reale. Sì, è un database ma esiste un modo per farlo? In tal caso, mantenendo un offset o quali query CQL posso usare?come eseguire lo streaming dei dati da una tabella cassandra?

+0

Qualcuno ha qualche idea su come scintilla-cassandra-connettore può essere utilizzato in questo? ci si prende cura dell'offset da solo e fa scorrere i dati quasi in tempo reale? –

risposta

5

Risposta breve è no.

La risposta lunga è con molta difficoltà e con i tasti di clustering intelligenti è possibile farlo. Fondamentalmente se si inseriscono dati con una chiave di clustering che aumenta sempre, è sempre possibile eseguire la scansione delle chiavi di clustering in un intervallo temporale recente. Naturalmente mancheranno inserti fuori ordine al di fuori della tua finestra. Questo può o non può essere abbastanza buono per il tuo caso d'uso.

Miglior risposta in futuro è Change Data Capture: https://issues.apache.org/jira/browse/CASSANDRA-8844

+0

Forse anche i trigger? –

+0

@RussS Grazie per il link buone informazioni –

+0

Qualcuno ha qualche idea su come utilizzare il connettore spark-cassandra in questo? ci si prende cura dell'offset da solo e fa scorrere i dati quasi in tempo reale? –