Quanto è veloce std :: swap per i tipi interi?

STL implementa una funzione generica std::swap per scambiare 2 valori. Può essere presentata nel modo seguente:Quanto è veloce std :: swap per i tipi interi?

template <class T> void swap (T& a, T& b) 
{ 
    T c(std::move(a)); 
    a=std::move(b); 
    b=std::move(c); 
}

Tuttavia, c'è un algoritmo XOR di swap per scambiare 2 numeri interi (http://en.wikipedia.org/wiki/XOR_swap_algorithm):

void swap_u(size_t& x, size_t& y) 
{ 
    x = x^y; 
    y = x^y; 
    x = x^y; 
}

Le mie domande:

È un'ottimizzazione al giorno d'oggi (su x86 o arm)?
Lo standard C++ favorisce questo tipo di ottimizzazione?
Esistono implementazioni STL reali in natura che hanno la specializzazione std::swap per i numeri interi?

fonte

2013-08-17 Sergey K.

+19

Lo scambio XOR non è necessariamente efficiente: è più una novità che una ottimizzazione utile: basta usare una variabile temporanea, mantenerla semplice ed evitare espedienti - lasciare che il compilatore faccia le cose intelligenti. –

La seconda implementazione non funzionerà se x e y puntano allo stesso indirizzo di memoria (potrebbe accadere se passi elementi di array con indici variabili). – sudeepdino008

Scambiare usando un registro per un temporaneo dovrebbe essere più veloce. E questo è ciò che il compilatore deve fare nel primo caso. – lapk

Nella maggior parte delle situazioni, lo scambio XOR non è un'ottimizzazione.

Vedere questo wiki entry.

Nella maggior parte degli scenari pratici, l'algoritmo di scambio banale che utilizza un registro temporaneo è più efficiente. situazioni limitate in cui XOR swap può essere pratico includono:

su un processore in cui la codifica del set di istruzioni permette lo scambio XOR essere codificato in un numero minore di byte;

In una regione con pressione di registro elevata, può consentire all'allocatore di registro di evitare di versare un registro.

Nei microcontrollori in cui la RAM disponibile è molto limitata.

Poiché queste situazioni sono rare, la maggior parte dei compilatori di ottimizzazione non genera il codice di scambio XOR.

Si noti inoltre che l'implementazione dello scambio XOR è interrotta. È necessario innanzitutto verificare che x e y non siano alias. Questo controllo renderà sicuramente lo scambio XOR più lento.

Non sono a conoscenza di alcuna implementazione di libreria standard che utilizza lo scambio XOR.

Si noti che, indipendentemente da ciò che implementa la libreria standard, se lo scambio XOR fosse davvero più veloce del normale swap, l'ottimizzazione dei compilatori farebbe uno peephole optimization per trasformarlo in uno scambio XOR. Questo è davvero il caso di lasciare che sia il compilatore a scegliere per te.

fonte

2013-08-17 10:00:19

E un controllo lo renderà ancora più lento ... –

+1 per la modifica relativa all'ottimizzazione dello spioncino. – lapk

Abbiamo imparato una buona lezione qui: ** Il codice Freaky-tricky-wiki non può essere un'ottimizzazione ** – Manu343726

Lo scambio XOR è in realtà solo un espediente e può non riuscire in alcuni casi (ad esempio, entrambe le variabili sono riferimenti allo stesso oggetto).

Lo scambio XOR non è particolarmente efficiente in quanto ha dipendenze seriali, pertanto richiederà sempre almeno tre cicli di istruzioni. Utilizzare uno scambio diretto con un temporaneo ha meno dipendenze, consentendo un certo parallelismo sulle moderne CPU superscalari: su alcune CPU può anche essere implementato in un'unica istruzione, ma anche senza istruzioni speciali può essere eseguito in due cicli.

fonte

2013-08-17 10:02:01

Su X86, un triplo scambio XOR tra posizioni di memoria (non registri CPU) richiede gli stessi cicli del processore di una copia tripla. Possono essere anche meno se il temporaneo è un registro.

fonte

2013-08-17 10:08:02

Quanto è veloce std :: swap per i tipi interi?

risposta

Problemi correlati