2009-11-22 11 views
22

Qualcuno ha esperienza di utilizzo di PostgreSQL per un'impostazione OLAP, utilizzo di cubi sul database ecc. Avendo incontrato un certo numero di idiosincrasie quando si utilizza MySQL per OLAP, ci sono motivi per l'utilizzo di PostgreSQL (supponendo che Voglio andare alla rotta open source)?Postgresql per OLAP

+3

Utilizziamo PostgreSQL 9.1 e Saiku. Tutti gli schemi dei cubi sono definiti in Schema Workbench (Pentaho). Finora, non vedo alcun problema con tale configurazione. Abbiamo tabelle di fatti con ca. 1.000.000 di file e tutto funziona bene senza alcuna pre-aggregazione. –

risposta

15

Esistono numerosi fornitori di software di data warehousing basati su Postgresql (e contribuiscono in modo abbastanza regolare alle modifiche correlate a OLAP). Controlla http://www.greenplum.com/ (nuovo URL: http://www.greenplum.org/). Penso che troverai che PG funziona molto meglio (per quasi tutti i carichi di lavoro, OLAP in particolare) rispetto a MySQL. Greenplum e altre soluzioni simili dovrebbero funzionare un po 'meglio di PG a seconda dei set di dati e dei casi d'uso.

+0

link interessante - grazie! – davek

+1

Humm .. sembra che questo link non sia più attivo. Hai un'alternativa? – neouser99

+1

@ neouser99 Lo cambiano su http://greenplum.org/ –

0

PGSQL è molto più adatto per il Data Warehousing rispetto a MySQL. All'inizio pensavamo di andare con MySQL, ma si comporta male nelle aggregazioni se i dati crescono fino a qualche milione di righe. PGSQL esegue quasi 20 volte più velocemente in caparison con MySQL per 20 milioni di record per una singola tabella dei fatti sulla stessa configurazione hardware. Se per qualche ragione scegli di utilizzare MySQL, dovresti utilizzare il motore di archiviazione MyISAM per le tabelle dei fatti piuttosto che InnoDB; vedrai prestazioni leggermente migliori.