Se si dispone di un RDD di chiave/valore (la chiave è l'indice della colonna) è possibile caricarlo in un dataframe? Per esempio:pySpark Crea DataFrame da RDD con chiave/valore
(0,1), (0,1), (0,2), (1,2), (1,10), (1,20), (3,18), (3,18), (3,18)
e hanno l'aspetto dataframe come:
1,2,18
1,10,18
2,20,18
È equivolento a 'rdd.toDF ([" id "," punteggio "])'? –
L'oggetto 'RDD' non ha attributo 'toDF'. Di fronte a questo errore –
Sto usando 1.6 spark e pyspark. Impossibile caricare sql.SQLContext e creare DataFrame al di fuori di esso. –