In Intel's optimization guide, punto 2.1.3, elencano una serie di miglioramenti al sottosistema cache e la memoria a Skylake (sottolineatura mia):La cache L2 Skylake è stata migliorata riducendo l'associatività?
La gerarchia di cache della microarchitettura Skylake ha i seguenti miglioramenti:
- Larghezza di banda della cache superiore rispetto alle generazioni precedenti.
- Gestione contemporanea di più carichi e depositi abilitati da buffer ingranditi.
- Il processore può eseguire due passaggi di pagina in parallelo rispetto a uno nella microarchitettura Haswell e alle generazioni precedenti.
- Penalità del carico suddiviso in pagine verso il basso da 100 cicli della precedente generazione a 5 cicli.
- L3 larghezza di banda di scrittura aumentata da 4 cicli pe r linea nella generazione precedente a 2 per riga.
- Supporto per l'istruzione CLFLUSHOPT per il lavaggio di linee telefoniche e gestione dell'ordine di memoria dei dati scaricati mediante SFENCE.
- Riduzione delle prestazioni ridotte per un precaricamento software che specifica un puntatore NULL.
- L'associatività L2 è cambiata da 8 vie a 4 vie.
quella finale catturato la mia attenzione. In che modo una riduzione del numero di modi in cui un miglioramento? Di per sé, sembra che un minor numero di modi sia strettamente peggiore di altri modi. Naturalmente, capisco che potrebbero esserci validi motivi ingegneristici per cui una riduzione del numero di modi potrebbe essere un compromesso che consente altri miglioramenti, ma qui è posizionata, di per sé, come un miglioramento.
Cosa mi manca?
Ecco [un'altra interessante teoria] (http://www.agner.org/optimize/blog/read.php?i=415#867): che lo Skylake-S (cioè Skylake originale) aveva diverse modifiche architettoniche in previsione del supporto di AVX-512 nelle ultime linee Skylake-X e Skylake Xeon, anche se Skylake-S non l'ha supportato. In particolare: _ [SKL riducendo l'associatività a 4] era la preparazione all'aumento della dimensione della cache: la cache SKL-S è solo un quarto della cache SKL-X con la stessa organizzazione e un'associatività ridotta consentita per ridurre il budget dei transistor di una cache di 1 MB. . Solo speculazioni ma comunque interessanti! – BeeOnRope
@BeeOnRope: sì, ho avuto lo stesso pensiero dopo aver letto [AnandTech's SKL-X writeup] (http://www.anandtech.com/show/11550/the-intel-skylakex-review-core-i9-7900x-i7 -7820x-e-i7-7800x-tested /), dove fanno la stessa affermazione: l'associatività L2 ridotta era almeno in parte per renderla più modulare. Quindi il presupposto che SKL-S ottenga un aumento generale del budget energetico altrove potrebbe non essere corretto. (Non lo esclude comunque. Potrebbe essere comunque un cambiamento generale buono o neutro per SKL-S. E Intel non lo farebbe se pensassero che fosse troppo brutto.) –