Ho un progetto CUDA. Consiste di diversi file .cpp che contengono la logica della mia applicazione e un file .cu che contiene più kernel e una funzione __host__
che li richiama.nvcc -Xptxas -v flag del compilatore non ha effetto
Ora vorrei determinare il numero di registri utilizzati dai miei kernel. La mia normale chiamata del compilatore si presenta così:
nvcc -arch compute_20 -link src/kernel.cu obj/..obj obj/..obj .. -o bin/..exe -l glew32 ..
.
L'aggiunta del flag del compilatore "-Xptxas -v" a questa chiamata purtroppo non ha alcun effetto. Il compilatore produce ancora lo stesso output testuale di prima. Anche l'exe compilato funziona allo stesso modo di prima con un'eccezione: il mio framerate salta a 1800fps, da 80fps in su.
questo non può essere corretto perché non risponde alla domanda .. Se si desidera solo un modo per contare i registri, quindi modificare la domanda. – jmilloy
@jimilloy "Ora vorrei determinare il numero di registri usati dai miei kernel" –