文章基于脉动阵列实现HEVC(High Efficiency Video Coding)中8×8的整数DCT(Discrete Cosine Transform)变换,改进通常使用的蝶型算法。整体架构基于脉动阵列的思想,并采用中间值数据重组的设计,使得变换模块可同时实现行列变换操作。只需得到列变换的第一个值便可开始行变换,充分利用了PE单元,减少变换时间并提高计算模块的并行性。文中方法不仅适用于DCT变换,也可用于其他的8×8矩阵相乘,具有通用性。综合结果表明,该设计最高可工作在203.8 MH