因为实验室服务器的CPU是Intel Xeon Gold系列,所以这里简要介绍一下Intel的Skylake-SP架构。
Skylake桌面版和Skylake服务器版(SP)最大的区别在于cache的层次结构不同了
实验室服务器Intel Gold 5118的cache层次结构如下
Cache Organization
L1$ 768 KiB
L1I$ 384 KiB 12x32 KiB 8-way set associative
L1D$ 384 KiB 12x32 KiB 8-way set associative write-back
L2$ 12 MiB
12x1 MiB 16-way set associative write-back
L3$ 16.5 MiB
12x1.375 MiB 11-way set associative write-back
更多的核,则需要更低的延迟,因而需要将更多数据放得更靠近CPU。(L2 cache比L3要快3.5-4倍)
这里还有很重要一点在于,SP的L3 cache是不包含的(non-inclusive)
几点变化总结如下