Ho difficoltà a trovare una libreria che permetta ai file Parquet di essere scritti usando Python. Punti bonus se posso usare Snappy o un meccanismo di compressione simile in congiunzione con esso.Metodi per scrivere file Parquet usando Python?
Finora l'unico metodo che ho trovato è l'utilizzo di Spark con il supporto per parquet pyspark.sql.DataFrame
.
Ho alcuni script che devono scrivere i file Parquet che non sono lavori Spark. C'è un approccio alla scrittura di file Parquet in Python che non coinvolge lo pyspark.sql
?
sembra che il formato Parquet ha thirft file di definizione non è possibile utilizzare questo per accedervi? – Srgrn