19
Ho una linea semplice:Convertire una semplice stringa di una riga di RDD in Spark
line = "Hello, world"
Vorrei convertirlo in un RDD con un solo elemento. Ho provato
sc.parallelize(line)
Ma ottenere:
sc.parallelize(line).collect()
['H', 'e', 'l', 'l', 'o', ',', ' ', 'w', 'o', 'r', 'l', 'd']
Tutte le idee?
In realtà, utilizzando sc.parallelize ([line]) raccogliere() ha lavorato. – poiuytrez
nella mia env (scala 2.10.3 spark-1.0.0) sc.parallelize ([line]). Collect() non funziona – michaeltang
Ho dimenticato di specificare che sto usando l'API python. – poiuytrez