抽象的
这是我的本科学位论文库,具有实验功能的NVIDIA Turing体系结构建模Tensor核心微体系结构。 在这项研究中,提出了图灵架构中的Tensor Core的微体系结构。 由于NVIDIA没有公开张量核心的内部,因此有必要通过微基准测试进行剖析。 在先前的研究中也已经剖析了NVIDIA GPU。 但是,并没有透露有关Turing体系结构的实验特性,即INT4(int 4位)操作模式和B1(二进制1位)操作模式。 在这项研究中分析了所有这些功能。
档案结构
基准每个目录代表每个数据类型