2015-12-02 26 views
5

Ho letto la documentazione di scintille e HBase:In quale versione HBase integra una scintilla API?

http://hbase.apache.org/book.html#spark

posso vedere che l'ultima versione stabile di HBase è 1.1.2, ma vedo anche che apidocs è in versione 2.0.0-SNAPSHOT e che la apidoc of spark è vuoto.

Sono confuso, perché l'apidocs e la versione HBase non corrispondono?

Il mio obiettivo è utilizzare Spark e HBase (bulkGet, bulkPut..etc). Come faccio a sapere in quale versione di HBase sono state implementate queste funzioni?

Se qualcuno ha una documentazione complementare su questo, sarà fantastico.

Sono su hbase-0.98.13-hadoop1.

+0

Sono anche affrontando lo stesso problema. Sembra che stiano ancora facendo lo sviluppo, quindi i documenti API sono vuoti. –

+0

Per quanto posso vedere, 'spark 1.6' sta usando' hbase 0.98.7'. – Shyam

risposta

0

Di seguito si riporta il biglietto principale JIRA per l'integrazione Spark in HBase, la versione di destinazione è 2.0.0 che ancora in fase di sviluppo, necessario in attesa del rilascio, o costruire una versione dal codice sorgente da soli

https://issues.apache.org/jira/browse/HBASE-13992

All'interno del ticket, ci sono diversi collegamenti per la documentazione.

Se si desidera solo per accedere HBase Spark RDD, si può considerare come normale origine dati Hadoop, sulla base di HBase TableInputFormat specifico e TableOutputFormat