Come sviluppatore, ho creato la tabella HBase per il nostro progetto importando i dati dalla tabella MySQL esistente utilizzando sqoop job
. Il problema è che il nostro team di analisti di dati ha familiarità con la sintassi di MySQL, implica che possono interrogare facilmente la tabella HIVE
. Per loro, ho bisogno di esporre la tabella HBase in HIVE. Non voglio duplicare i dati popolando nuovamente i dati in HIVE. Inoltre, la duplicazione dei dati potrebbe avere problemi di coerenza in futuro.Come accedere alla tabella HBase in Hive e viceversa?
Posso esporre tavolo HBase in HIVE senza duplicare i dati? Se sì, come lo faccio? Inoltre, se nella mia tabella HBase sono presenti dati insert/update/delete
, i dati aggiornati vengono visualizzati in HIVE senza problemi?
A volte il nostro team di analisi dei dati crea tabelle e inserisce dati in HIVE. Posso esporli a HBase? Se sì, come?
Che dire inversa? Ho tavolo HIVE e lo espongo a HBase? – Abhishek
@Abhishek Finché si scrive su una tabella HIVE memorizzata da HBaseStorageHandler, la tabella e i dati che contiene sono memorizzati in HBase. Il tuo team può creare tutte le tabelle memorizzate HBase (esterne o meno) come preferiscono in HIVE e "INSERIRE ... SELEZIONA ..." in esse, i dati saranno immediatamente disponibili in HBase al termine della query. Provalo. –
Capito .. Grazie :) – Abhishek