Sto seguendo le istruzioni a this SO answer ma quando provo a eseguire il file risultante PTX ottengo l'errore seguito in clBuildEstern non risolto durante la compilazione di OpenCL in PTX utilizzando Clang?
ptxas fatal : Unresolved extern function 'get_group_id'
Nel file PTX ho il seguente per ogni chiamata di funzione OpenCL Io uso
.func (.param .b64 func_retval0) get_group_id
(
.param .b32 get_group_id_param_0
)
;
Quanto sopra non è presente nei file PTX creati dal runtime OpenCL quando fornisco un file CL. Invece ha il registro speciale appropriato.
seguito these instructions (link nei confronti di una biblioteca libclc diversa) mi dà un errore di segmentazione durante la LLVM IR per la compilazione PTX con il seguente errore:
fatal error: error in backend: Cannot cast between two non-generic address spaces
sono quelle istruzioni ancora valido? C'è qualcos'altro che dovrei fare?
sto utilizzando l'ultima versione di libclc, Clang 3.7, e il driver Nvidia 352,39