So che questo è un thread più vecchio ma ci sono stati alcuni sviluppi nell'ultimo anno o giù di lì. Confrontando il data warehouse con Hadoop è come paragonare le mele alle arance. Il data warehouse è un concetto: dati puliti e integrati di alta qualità. Non credo che la necessità di un data warehouse andrà via presto. Hadoop d'altra parte è una tecnologia. È un framework di calcolo distribuito per elaborare grandi volumi di dati. In passato i data warehouse venivano generalmente costruiti su database relazionali e appliance di data warehouse. Tuttavia, negli ultimi due anni sono emerse varie limitazioni del RDBMS (costi di licenza in aumento a fronte di volumi di dati in crescita, inadeguati per l'interrogazione di grafici e gerarchie e l'ingestione di tipi di dati non strutturati, ecc.). Allo stesso tempo, i motori di query MPP SQL su Hadoop sono apparsi come Apache Drill che ora rende possibile interrogare i dati che si trovano su Hadoop.
Ho scritto tutta una serie di post sull'argomento se sei interessato a tutti i dettagli. Data Warehousing in the age of big data. The end of an era?
fonte
2015-06-16 09:26:21