Desidero aggiungere i quattro componenti di un registro SSE per ottenere un singolo float. Ecco come faccio ora:aggiunta dei componenti di un registro SSE
float a[4];
_mm_storeu_ps(a, foo128);
float x = a[0] + a[1] + a[2] + a[3];
C'è un'istruzione SSE che raggiunge direttamente questo?
Dubito che esista, ma se lo fa, l'istruzione probabilmente inserirà il risultato in una regione a 32 bit del registro di uscita a 128 bit, non in un registro a 32 bit stesso. –