Mi chiedevo se esistesse un modo più efficiente di scrivere a = a + b + c? thrust::transform(b.begin(), b.end(), c.begin(), b.begin(), thrust::plus<int>());
thrust::transform(a.begin(), a.end(), b.be
Ho una matrice di numeri interi senza segno memorizzati sulla GPU con CUDA (in genere 1000000 elementi). Mi piacerebbe contare l'occorrenza di ogni numero nell'array. Ci sono solo pochi numeri distint
Sono un principiante di Spinta. Vedo che tutte le presentazioni e gli esempi di Thrust mostrano solo il codice host. Mi piacerebbe sapere se posso passare un device_vector al mio kernel? Come? Se sì,