sto cercando di ottimizzare il codice RK4 GCC C++ utilizzando__builtin_prefetch, quanto legge?
__builtin_prefetch
Sto avendo alcuni problemi cercando di capire come prefetch un'intera classe. Non capisco quanto del const void *addr
venga letto. In modo che ho caricato i seguenti valori di from
e to
.
for (int i = from; i < to; i++)
{
double kv = myLinks[i].kv;
particle* from = con[i].Pfrom;
particle* to = con[i].Pto;
//Prefetch values at con[i++].Pfrom & con[i].Pto;
double pos = to->px- from->px;
double delta = from->r + to->r - pos;
double k1 = axcel(kv, delta, from->mass) * dt; //axcel is an inlined function
double k2 = axcel(kv, delta + 0.5 * k1, from->mass) * dt;
double k3 = axcel(kv, delta + 0.5 * k2, from->mass) * dt;
double k4 = axcel(kv, delta + k3, from->mass) * dt;
#define likely(x) __builtin_expect((x),1)
if (likely(!from->bc))
{
from->x += ((k1 + 2 * k2 + 2 * k3 + k4)/6);
}
}
Link: http://www.ibm.com/developerworks/linux/library/l-gcc-hacks/
Non credo che ci sia molto da fare in tale micro-ottimizzazione, per scopi diversi dall'apprendimento. I cpus moderni sono molto bravi a prefetching da soli. – ronag
Probabilmente, ma ho 1 funzione chiamata quasi 1 miliardo di volte. – Mikhail