Dopo l'analisi alcuni jsons ho un dataframe una colonna di arrayCome posso flatMap una fila di matrici in più righe?
scala> val jj =sqlContext.jsonFile("/home/aahu/jj2.json")
res68: org.apache.spark.sql.DataFrame = [r: array<bigint>]
scala> jj.first()
res69: org.apache.spark.sql.Row = [List(0, 1, 2, 3, 4, 5, 6, 7, 8, 9)]
Vorrei esplodere ogni riga fuori in più righe. Come?
edit:
originale del file JSON:
{"r": [0,1,2,3,4,5,6,7,8,9]}
{"r": [0,1,2,3,4,5,6,7,8,9]}
Voglio una RDD o un dataframe con 20 righe.
non posso semplicemente utilizzare flatMap qui - io non sono sicuro di quello che il comando appropriato nella scintilla è:
scala> jj.flatMap(r => r)
<console>:22: error: type mismatch;
found : org.apache.spark.sql.Row
required: TraversableOnce[?]
jj.flatMap(r => r)
per favore pubblica l'esempio json originale e l'esempio del risultato che ti aspetti – vvladymyrov
@vvladymyrov è nella modifica – dranxo