为了提高移动图形处理器中统一架构染色器的效率,减少其与片外存储器间的访问次数,提出了一种4端口纹理高速缓存结构。该结构采用基于Mipamp算法的纹理映射和基于细化层次(Level of Detail,LOD)选择不同单端口Cache的存储方式,提高了纹理Cache的命中率。此外为了提高数据吞吐率,采用4端口并行读取纹素。设计了FIFO缓冲区预取数据,降低访存延迟。利用SV搭建实验平台对纹理图像进行测试,结果表明纹理Cache的平均命中率为92.5%,数据吞吐率接近单端口Cache的4倍。
双窗口缓存
双窗口缓存使用两个滑动窗口自适应地协调LRU与LFU的比率。
性能比较
命中率 (%)
LRU的x0.9-2.8命中率更高。
'LRU hit rate even 100', 10.0505
'DWC hit rate even 100', 10.113
'LFU ratio even 100', 43, 43
'DWC / LRU hit rate ratio even 100', '100%'
'LRU hit rate uneven 100', 18.5265
'DWC