Nelle versioni precedenti di CUDA, atomicAdd non è stato implementato per i doppi, quindi è normale implementarlo come here. Con il nuovo CUDA 8 RC, mi imbatto in problemi quando provo a compilare il mio codice che include tale funzione. Immagino che ciò sia dovuto al fatto che con Pascal e Compute Capability 6.0 è stata aggiunta una versione nativa doppia di atomicAdd, ma in qualche modo non è correttamente ignorata per le precedenti capacità di calcolo.CUDA atomicAdd per errore di definizione doppi
Il codice di seguito utilizzato per compilare ed eseguire bene con le versioni precedenti CUDA, ma ora ottenere questo errore di compilazione:
test.cu(3): error: function "atomicAdd(double *, double)" has already been defined
Ma se rimuovo la mia applicazione, ho invece ottenere questo errore:
test.cu(33): error: no instance of overloaded function "atomicAdd" matches the argument list
argument types are: (double *, double)
Devo aggiungere che vedo solo questo se compilo con -arch=sm_35
o simile. Se compilo con -arch=sm_60
ottengo il comportamento previsto, cioè solo il primo errore e la compilazione riuscita nel secondo caso.
Modifica: Inoltre, è specifico per atomicAdd
- se cambio il nome, funziona bene.
Sembra davvero un bug del compilatore. Qualcun altro può confermare che questo è il caso?
codice Esempio:
__device__ double atomicAdd(double* address, double val)
{
unsigned long long int* address_as_ull = (unsigned long long int*)address;
unsigned long long int old = *address_as_ull, assumed;
do {
assumed = old;
old = atomicCAS(address_as_ull, assumed,
__double_as_longlong(val + __longlong_as_double(assumed)));
} while (assumed != old);
return __longlong_as_double(old);
}
__global__ void kernel(double *a)
{
double b=1.3;
atomicAdd(a,b);
}
int main(int argc, char **argv)
{
double *a;
cudaMalloc(&a,sizeof(double));
kernel<<<1,1>>>(a);
cudaFree(a);
return 0;
}
Edit: ho ricevuto una risposta da Nvidia che riconoscono questo problema, e qui è ciò che gli sviluppatori dicono su di esso:
The sm_60 architecture, that is newly supported in CUDA 8.0, has native fp64 atomicAdd function. Because of the limitations of our toolchain and CUDA language, the declaration of this function needs to be present even when the code is not being specifically compiled for sm_60. This causes a problem in your code because you also define a fp64 atomicAdd function.
CUDA builtin functions such as atomicAdd are implementation-defined and can be changed between CUDA releases. Users should not define functions with the same names as any CUDA builtin functions. We would suggest you to rename your atomicAdd function to one that is not the same as any CUDA builtin functions.
Mi sembra un errore in CUDA 8 RC. Sembra che il doppio atomicAdd() nativo funzioni solo con sm_60, ma può essere visto anche con sm_35.Forse potresti risolvere il problema rinominando la tua versione. – kangshiyin
@Eric Sì, la ridenominazione lo risolve. Post modificato per includerlo. – kalj