Sto cercando di utilizzare Presto su Amazon S3 bucket, ma non ho trovato molte informazioni correlate su Internet.Presto su Amazon S3
Ho installato Presto su una micro istanza, ma non sono in grado di capire come connettermi a S3. C'è un secchio e ci sono dei file. Ho un server metastore hive in esecuzione e l'ho configurato in presto hive.properties. Ma quando provo a eseguire il comando LOCATION in hive, non funziona.
IT genera un errore dicendo che non è possibile trovare lo schema di file tipo s3.
E anche io non so perché abbiamo bisogno di eseguire hadoop ma senza hadoop l'alveare non esegue. C'è qualche spiegazione a questo.
This e this sono le documentazioni che ho seguito durante l'installazione.
Grazie per la risposta. Voglio provare presto senza nessun costo associato. Per favore controlla le modifiche, ho avuto più dubbi dopo aver esaminato il materiale pertinente che hai appena menzionato. – Codex
Con Amazon EMR incorrerei in costi, quindi sto cercando di evitarlo. C'è un modo per aggirare questo. – Codex
Ho scritto il seguente [post] (http://blog.danielcorin.com/code/2016/04/11/querying-s3-with-presto.html) l'anno scorso sull'argomento. Non ho provato la configurazione da allora ma c'è una possibilità che potrebbe aiutare. L'idea generale è di utilizzare un contenitore Docker come metastore Hive in modo che non sia necessario un servizio gestito come EMR solo per il routing delle query Presto. –