Sto costruendo un sistema per analizzare grandi quantità di dati finanziari relativi ai prezzi degli scambi di titoli. Una grande sfida in questo è determinare quale metodo di archiviazione utilizzare per i dati dato che i dati saranno nei 10 di terrabytes. Ci saranno molte query sui dati come il calcolo delle medie, il calcolo delle deviazioni standard e somme filtrate da colonne multiple come prezzo, tempo, volume, ecc. Le dichiarazioni di join non sono un requisito, ma sarebbe bello avere.Archiviazione dati per analisi finanziarie
In questo momento, sto esaminando l'edizione della community infobright community, monetdb e greenplum per scopi di valutazione. Sembrano eccezionali finora, ma per le funzionalità più avanzate, alcune di queste sono richieste non sono disponibili in alcune di queste edizioni (utilizzando più server, istruzioni di inserimento/aggiornamento, ecc.).
Quali soluzioni utilizzeresti per questa situazione e quali vantaggi offre rispetto alle alternative? Essere redditizi è un vantaggio importante. Se devo pagare per una soluzione di data warehousing lo farò, ma lo preferirei piuttosto evitarlo e prendere l'itinerario open-source/community se possibile.
In realtà (pariale) somme, medie, stddevs - anche se filtrate - non sono data mining. Sono semplicemente ** statici **. –
Il data mining è la scoperta di nuove informazioni da un insieme di dati. Le statistiche sono uno strumento per aiutare in questo processo. Non penso che una tale enfasi sulla terminologia sia favorevole e, se ne discutiamo, non otterremo nulla.È come se dicessi che non sono d'accordo con il tuo post perché hai infastidito le statistiche come "statiche" - è un'enfasi inutile sul tecnicismo. Il mio obiettivo è utilizzare questo database per scoprire nuove informazioni. Inoltre, le soluzioni di data warehousing sono costruite pensando al data mining. Pertanto, il concetto di data mining è applicabile qui. – user396404
Tuttavia, sono d'accordo con te sul fatto che "database" è probabilmente un tag migliore per questo post. – user396404