SDBI:简单的动态批处理推断-源码简单的动态批处理推断解决了什么问题？绝对，Batch对于GP

文件名称: SDBI:简单的动态批处理推断-源码

所属分类: 其它

开发工具:

文件大小: 18kb

下载次数: 0

上传时间: 2021-03-04

提供者: weixin_********

下载 (18kb)

不能下载？报告错误

详细说明：简单的动态批处理推断解决了什么问题？绝对，Batch对于GPU上深度学习模型的运行效率影响很大。。。是在推理时。搜索，推荐等服务自带比较大的批处理。问题不大。但更多场景面临的往往是稀碎的请求（只有一次一张图）。如果想提高服务的吞吐，把稀碎的请求动态攒成批处理再送GPU处理就是刚需。 NV的Triton包含了动态批处理功能。我也用cpp写过一版。但是发现在部署，特别是给别人用python来调用的时候，始终是比较麻烦的。上方，走个本地rpc等。。反过来想，只要程序损坏还卡在计算上，就有机会用python写一版至少吞吐上可以打平cpp的动态批处理。好处是使用会方便很多。出于个人需要和兴趣，在基于multiprocess.Queue写过一版之前进行动态批处理。但是队列本身对于继承的影响非常大，数字比较严重。最近发现的Python 3.8支持了共享内存，用python写了个基于Sha

(系统自动生成,下载前可以参看下载内容)