Sto sviluppando un programma che deve eseguire calcoli di algebra lineare pesante.Algebra lineare parallela per sistema multicore
Ora sto usando le routine LAPACK/BLAS, ma ho bisogno di sfruttare la mia macchina (24 core Xeon X5690).
ho trovato progetti come pblas e ScaLAPACK, ma tutti sembrano concentrarsi sul calcolo distribuito e sull'utilizzo di MPI.
Non ho alcun cluster disponibile, tutti i calcoli verranno eseguiti su un singolo server e l'utilizzo di MPI sembra un eccessivo.
Qualcuno ha qualche suggerimento su questo?
Non cancellare usando MPI, specialmente se non si riescono a trovare le librerie abilitate per MPI per fare il lavoro pesante. Potrebbe essere più facile che trovare librerie per l'algebra lineare a memoria condivisa o scrivere il proprio codice di memoria condivisa. Un'ottima implementazione MPI funzionerà in modo efficiente su un computer con memoria condivisa. –
Lo so. Non volevo dire che avrei scritto codice MPI da solo. Volevo semplicemente evitare tutto ciò che utilizza MPI poiché questo non sarà un programma cluster e voglio evitare qualsiasi overhead non necessario – Patrik
Voting per chiudere come tool rec/too broad. –