图形处理器(graphic processing unit, GPU)的最新发展已经能够以低廉的成本提供高性能的通用计算。基于GPU 的CUDA (compute unified device architecture)和OpenCL (open computing language)编程模型为程序员提供了充足的类似于C 语言的应用程序接口(application programming interface, API), 便于程序员发挥GPU 的并行计算能力。采用图形硬件进行加速计算, 通过一种