2012-01-18 3 views
7

Mi è stato chiesto di prototipare due framework ETL. I requisiti sono i seguenti:Open Source ETL framework

  • Open Source
  • Disponibile per Linux
  • Mantenuto
  • registri possono essere visualizzati sul browser web (bello avere)
  • Scritto in Perl, Python, Ruby o Java

Il file raw può essere qualsiasi cosa (excel, csv, pagina HTML ecc.) Il database di destinazione è MySQL.

Non basta eliminare i nomi, si prega di indicare i vantaggi/gli svantaggi in base alla propria esperienza.

Grazie!

risposta

3

Ho usato Kettle. Ha una propria GUI, ma se preferisci usare l'API per fare da solo l'ETL è anche supportato. Si è rivelato molto utile per me e ci sono già alcuni plugin disponibili per questo.

+0

cool, grazie, proverò questo – jchips12

6

Uno dei più popolari ETL basati su Java sarebbe Talend.

Jaspersoft ETL è un altro esteso da Talend e ha una buona interfaccia utente basata su eclissi.

+0

grazie, valuterò questo. – jchips12

2

Un'altra opzione è CloverETL. È scritto in Java e c'è una versione open source LGPL del suo motore. Inoltre ha una versione gratuita di GUI chiamata CloverETL Community.

È in grado di elaborare qualsiasi sorgente indicata e si connette a un numero di database, incluso MySQL.