当线程的控制流在一次扭曲中分叉时,GPGPU通常会遇到性能下降的情况。 基于再收敛堆栈的控制流处理方案已在GPU架构中广泛采用。 此类堆栈的深度始终设置为较大的值,以便可以有足够的条目供扭曲的嵌套分支使用。 但是,对于经历简单分支甚至没有分支的经线,那些深度重新聚合堆栈将保持空闲状态,从而导致严重浪费硬件资源。 而且,随着GPU架构的发展,越来越多的扭曲将被部署在GPU流处理器核心上,这样的问题可能会变得更加严重。 为了解决这个问题,本文提出了一种动态再收敛堆栈结构,其中所有池都共享一个堆栈池,