第八课 高速缓存器

对于直接映射的块交换还无法形成完整的逻辑自洽
- 如何求的块内地址、标记、cache行号
- 如何根据主存地址去寻找

寄存器和Cache就集成在CPU中了
内存墙：CPU的速度比内存（受限于电容）的速度快得多
解决：CPU和内存之间增加Cache

工作

工作原理

工作流程

如何判断是命中还是未命中？
如果未命中，为什么不直接把所需要的字从内存传送到CPU？
- 时间局部性
如果未命中，为什么从内存中读入一个块而不只读入一个字？
- 空间局部性
使用Cache后需要更多的操作，为什么还可以节省时间？

命中VS未命中

通过这种映射关系判断有无命中

程序访问的局部性原理

把块给Cache，把字给处理器
两种方式时间开销上无较大差异
系统总线代表主存，主存速度很慢，而CPU会一直申请数据，所以需要缓冲器

因为会重复访问特定的数据

字在某一个块中，传递块而不是字
通过标记，判断字所在的块命中了，则字命中了=>所以块是预先划分好的
方便访问相邻数据

平均访问时间

Tc：做的是检查
Ta = 检查时间+访问主存的时间（1-p 需要访问）

降低Tm很难，受到电容的限制
命中率高要求cache大，而这会使访问cache时间变大

Cache未命中原因

容量失效：原8kb的数据块访问后被后面的8kb的数据覆盖。如果再要访问到该8kb的数据，因为已经被替换了，则会失败，导致失效
冲突失效：

Cache的设计要素

容量：太大-命中率低；太低：容量失效
映射功能：冲突失效
替换算法：用一个更小的区域放一个更大的区域，有更高概率被访问的数据留下来
写策略
Cache行大小（主存的块大小）
Cache数目

容量

涉及到的空间局部性和所需的数据更大，则容量设置的更大

映射功能

直接映射

使用地址的高2位就可以指向具体的行
**M是128/8=16，C=4 所以n=2：**
16个块，有4行，所以一行中有4个块，所以需要2位标记

CPU寻找主存，通过主存地址进行寻找
一个块包含很多字，一个块对应的是cache中的一行。
所以要通过块内地址找到块中具体的字在哪里。