Sto avendo qualche problema con l'esecuzione di lavori di Hadoop sia in gruppo pseudo e in modalità cluster con Ubuntu 16.04.disconnessioni durante l'esecuzione di Hadoop sotto Ubuntu 16.04
Durante l'esecuzione di un'installazione vanila hadoop/hdfs, l'utente di hadoop ottiene disconnesso e tutti i processi eseguiti da questo utente vengono chiusi. Non vedo nulla che indichi nei registri (/ var/log/systemd, journalctl o dmesg) che spiega il motivo per cui l'utente viene disconnesso.
Sembra che io non sono l'unico che ha problemi con questo o problema simile:
https://stackoverflow.com/questions/38288162/in-ubuntu-16-04-running-hadoop-jar-laptop-gets-rebooted
Nota: la creazione utente speciale Hadoop non avevano in realtà risolto il problema nel mio caso - ma limitato le disconnessioni per l'utente dedicato.
E 'possibile che qualche problema in giro per la classe UserGroupInformation (che può in alcune circostanze causare un logout), con forse alcuni cambiamenti nella systemd in Ubuntu 16.04 può causare questo comportamento?
Le ultime righe di log Hadoop che ricevo prima della disconnessione:
...
16/07/13 16:45:37 DEBUG ipc.ProtobufRpcEngine: Call: getJobReport took 4ms
16/07/13 16:45:37 DEBUG security.UserGroupInformation: PrivilegedAction
as:hduser (auth:SIMPLE)
from:org.apache.hadoop.mapreduce.Job.updateStatus(Job.java:320)
16/07/13 16:45:37 DEBUG ipc.Client: IPC Client (1360814716) connection to
laptop/127.0.1.1:37339 from hduser sending #375
16/07/13 16:45:37 DEBUG ipc.Client: IPC Client (1360814716) connection to
laptop/127.0.1.1:37339 from hduser got value #375
16/07/13 16:45:37 DEBUG ipc.ProtobufRpcEngine: Call: getJobReport took 2ms
Terminated
[email protected]:~$ 16/07/13 16:45:37 DEBUG ipc.Client: stopping client from
cache: [email protected]
exit
journalctl:
Jul 12 16:06:44 laptop systemd-logind[978]: Removed session 7.
Jul 12 16:06:44 laptop systemd-logind[978]: Removed session 6.
Jul 12 16:06:44 laptop systemd-logind[978]: Removed session 5.
Jul 12 16:06:44 laptop systemd-logind[978]: Removed session 8.
syslog:
Jul 12 16:06:43 laptop systemd[4172]: Stopped target Default.
Jul 12 16:06:43 laptop systemd[4172]: Reached target Shutdown.
Jul 12 16:06:44 laptop systemd[4172]: Starting Exit the Session...
Jul 12 16:06:44 laptop systemd[4172]: Stopped target Basic System.
Jul 12 16:06:44 laptop systemd[4172]: Stopped target Sockets.
Jul 12 16:06:44 laptop systemd[4172]: Stopped target Paths.
Jul 12 16:06:44 laptop systemd[4172]: Stopped target Timers.
Jul 12 16:06:44 laptop systemd[4172]: Received SIGRTMIN+24 from PID
10101 (kill).
Jul 12 16:06:44 laptop systemd[1]: Stopped User Manager for UID 1001.
Jul 12 16:06:44 laptop systemd[1]: Removed slice User Slice of hduser.
Ho aggiornato il file logind.conf. Questo ha funzionato sul mio portatile ma non sulla VM che utilizzo. –