Perché std :: find è implementato in questo modo?

Mi capita di imbattersi nella fonte di std::find e trovarlo confuso da me. In sostanza si divide il numero di elementi da 4 e fare il confronto 4 in ogni turno:Perché std :: find è implementato in questo modo?

template<typename _RandomAccessIterator, typename _Tp> 
_RandomAccessIterator 
__find(_RandomAccessIterator __first, _RandomAccessIterator __last, 
    const _Tp& __val, random_access_iterator_tag) 
{ 
    typename iterator_traits<_RandomAccessIterator>::difference_type 
__trip_count = (__last - __first) >> 2; 

    for (; __trip_count > 0; --__trip_count) 
{ 
    if (*__first == __val) 
    return __first; 
    ++__first; 

    if (*__first == __val) 
    return __first; 
    ++__first; 

    if (*__first == __val) 
    return __first; 
    ++__first; 

    if (*__first == __val) 
    return __first; 
    ++__first; 
} 

    switch (__last - __first) 
{ 
case 3: 
    if (*__first == __val) 
    return __first; 
    ++__first; 
case 2: 
    if (*__first == __val) 
    return __first; 
    ++__first; 
case 1: 
    if (*__first == __val) 
    return __first; 
    ++__first; 
case 0: 
default: 
    return __last; 
} 
}

Non ho idea del motivo per cui è fatto in questo modo. Sembra un po 'di ottimizzazione. Ma non penso che questo avvantaggi il multi-core così facile. Questo è in una singola discussione comunque.

Qualche idea?

fonte

2013-02-18 eltonsky

Sembra ciclo srotolamento manuale. Da dove viene questa implementazione? –

Per prima cosa, dedica meno tempo a confrontare "__trip_count' a zero e più tempo a confrontare effettivamente i valori. –

Sembra loop unwinding, noto anche come srotolamento del ciclo.

fonte

2013-02-18 12:36:06

È lo srotolamento del ciclo. Il risultato è lo stesso, ma è più amichevole per il processore.

La complessità asintotica è la stessa però.

fonte

2013-02-18 12:36:15

-2

È Duff's device. È una vecchia tecnica di ottimizzazione che mescola mentre e cambia le istruzioni in un modo speciale. Utilizza il ciclo di annullamento. In assembler si saltava all'interno di un loop srotolato.

fonte

2013-02-18 12:38:22

Non è il dispositivo di Duff, l'istruzione switch non è all'interno del loop. Molto probabilmente il codice emesso sarebbe più piccolo se usasse il dispositivo di Duff, comunque. –

Ok colpa mia. Non ho letto abbastanza bene il codice. –

@SteveJessop: Avevo l'impressione che tu mettessi il dispositivo di Duff alla fine del ciclo srotolato non al suo interno. Solo l'ultima iterazione avrà un conteggio non completo. –

Non essendo completamente sicuro, penso che si tratti di un ciclo di srotolamento.

See Loop svolgimento in: http://www.codeproject.com/Articles/6154/Writing-Efficient-C-and-C-Code-Optimization

fonte

2013-02-18 12:38:23

Perché std :: find è implementato in questo modo?

risposta

Problemi correlati