TL; DR Come posso collegare un driver locale a uno spark cluster tramite un proxy SOCKS.Connessione per attivare un proxy SOCKS
Abbiamo un cluster di accensione sul posto dietro un firewall che blocca la maggior parte delle porte. Abbiamo accesso ssh, quindi posso creare un proxy SOCKS con ssh -D 7777 ...
.
Funziona correttamente per la navigazione delle UI Web quando il mio browser utilizza il proxy, ma non so come utilizzarlo.
Finora ho questo, che ovviamente non è configurando deleghe:
val sconf = new SparkConf()
.setMaster("spark://masterserver:7077")
.setAppName("MySpark")
new SparkContext(sconf)
che registra questi messaggi di 16 volte prima di gettare un'eccezione.
15/01/20 14:43:34 INFO Remoting: Starting remoting
15/01/20 14:43:34 ERROR NettyTransport: failed to bind to server-name/ip.ip.ip.ip:0, shutting down Netty transport
15/01/20 14:43:34 INFO RemoteActorRefProvider$RemotingTerminator: Shutting down remote daemon.
15/01/20 14:43:34 WARN Utils: Service 'sparkDriver' could not bind on port 0. Attempting port 1.
15/01/20 14:43:34 INFO RemoteActorRefProvider$RemotingTerminator: Remote daemon shut down; proceeding with flushing remote transports.
15/01/20 14:43:34 INFO RemoteActorRefProvider$RemotingTerminator: Remoting shut down.