Ho sentito un nuovo termine Data Lake. Ho cercato su google cheHadoop Vs Data Lake
Un data lake è un archivio di archiviazione su larga scala e un motore di elaborazione. Un data lake fornisce "spazio di archiviazione per qualsiasi tipo di dati, enorme potenza di elaborazione e la capacità di gestire attività o lavori concomitanti virtualmente illimitati"
Il termine data lake è spesso associato all'archiviazione di oggetti orientata a Hadoop. In tale scenario, i dati di un'organizzazione vengono prima caricati nella piattaforma Hadoop, quindi gli strumenti di business analytics e data mining vengono applicati ai dati in cui risiedono sui nodi cluster di Hadoop dei computer commodity.
La stessa cosa è fatta da Hadoop. Abbiamo HDFS per lo storage e MapReduce per il calcolo. Sono un po 'confuso su Hadoop e Data Lake. Qual è la differenza tra entrambi. Se sono uguali, perché questo termine si presenta. O come definire un lago di dati.
un quadro più selettivo e utilizzabile per l'analisi aziendale? hadoop bisogno di più comprensione su come integrare l'algoritmo di analisi esterna in MapReduce se non mi sbaglio – AchmadJP
povero me ne ho sentito parlare oggi. LOL –