Quindi c'è questa nuova cosa interessante, questi database NoSQL. E così ci sono i miei dati: righe di righe di file di dati meteorologici: valori, che rappresentano determinate misurazioni in una determinata stazione (identificate da un numero WMO, non coordinate), in un dato momento.NoSQL e dati meteorologici
Non tutte le stazioni misurano tutti i parametri, non tutti i parametri vengono misurati continuamente.
Memorizzo questi dati (valore di 30 anni di valori orari, risultanti in ~ 1 miliardo di valori) attualmente in MySQL. La crescita continua e l'aggiunta prevedibile di ulteriori dati mi danno un po 'di mal di testa.
Leggendo i sistemi NoSQL basati su documenti che sembrano scalare piuttosto facilmente, mi chiedevo se NoSQL è un concetto di archiviazione dati fattibile anche per i dati meteorologici. Hai qualche esperienza con questo?
Aggiornamento: ha dimenticato le query tipiche: la maggior parte delle query richiede dati nell'asse temporale: I.e. Datemi le temperature della stazione 066310 dal 01.01.2010 alle 00:00 all'01/03/2010 alle 00:00.
Oppure: fornirmi i valori più recenti di tutti i parametri di una particolare stazione.
Ciò di cui abbiamo veramente bisogno di sapere se dovremmo essere in grado di rispondere alla tua domanda è come si utilizza i dati. Che tipo di domande si esegue su di esso. – adamse
Ah, ho dimenticato. Grazie, ho aggiunto due campioni. –
Che cosa ti sta causando un mal di testa? Gestione del database? Prestazione? Aggregazione dei dati? Qualcos'altro? Se le sue prestazioni sono correlate, hai analizzato il piano di query per le tue query? Forse hai bisogno di indici migliori o di ottimizzare le impostazioni del tuo database (PostgreSQL è ottimo in questo). Quanto è grande il set di dati: disco saggio. 1 GB? Di Più? Di meno? – Mike