2013-09-27 12 views

risposta

1

Penso che troverete il seguente articolo molto utile ai vostri pensieri.

It’s important to divide the techniques of data warehousing from the implementation. Hadoop (and the advent of NoSQL databases) will auger the demise of data warehousing appliances and the “traditional” single database implementation of a data warehouse. 
It is safe to say that traditional, single server relational databases or database appliances are not the future of big data or data warehouses. 
On the other hand, the techniques of data warehousing to include Extract-Transform-and-Load (ETL), dimensional modeling and business intelligence will be adapted to the new Hadoop/NoSQL environments. 

Da: http://gcn.com/blogs/reality-check/2014/01/hadoop-vs-data-warehousing.aspx

6

So che questo è un thread più vecchio ma ci sono stati alcuni sviluppi nell'ultimo anno o giù di lì. Confrontando il data warehouse con Hadoop è come paragonare le mele alle arance. Il data warehouse è un concetto: dati puliti e integrati di alta qualità. Non credo che la necessità di un data warehouse andrà via presto. Hadoop d'altra parte è una tecnologia. È un framework di calcolo distribuito per elaborare grandi volumi di dati. In passato i data warehouse venivano generalmente costruiti su database relazionali e appliance di data warehouse. Tuttavia, negli ultimi due anni sono emerse varie limitazioni del RDBMS (costi di licenza in aumento a fronte di volumi di dati in crescita, inadeguati per l'interrogazione di grafici e gerarchie e l'ingestione di tipi di dati non strutturati, ecc.). Allo stesso tempo, i motori di query MPP SQL su Hadoop sono apparsi come Apache Drill che ora rende possibile interrogare i dati che si trovano su Hadoop.

Ho scritto tutta una serie di post sull'argomento se sei interessato a tutti i dettagli. Data Warehousing in the age of big data. The end of an era?

1

ho trovato questo http://www.b-eye-network.com/view/17017 che descrive la differenza dei big data e dei dati ware house

quando mettiamo a confronto i dati di una soluzione grande per un data warehouse, che cosa troviamo? Scopriamo che una soluzione Big Data è una tecnologia e che il data warehouse è un'architettura. Sono due cose molto diverse. Una tecnologia è proprio questo: un mezzo per archiviare e gestire grandi quantità di dati . Un data warehouse è un modo di organizzare i dati in modo che ci sia la credibilità e l'integrità aziendale di . Quando qualcuno prende i dati da un data warehouse , quella persona sa che altre persone stanno utilizzando gli stessi dati per altri scopi. Esiste una base per la riconciliazione dei dati quando esiste un data warehouse.