您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 【TensorRT】TensorRT的INT8校准原理

  2. INT8校准就是原来用32bit(float32)表示的tensor现在用8bit来表示,并且要求精度不能下降太多。 将FP32转换为 INT8的操作需要针对每一层的输入tensor和网络学习到的参数进行。 但是不同网络结构的不同layer的激活值分布很不一样,因此合理的量化方式。应该适用于不同的激活值分布,并且减小信息损失。 使用相对熵(也叫KL散度)来衡量不同的INT8分布与原来的FP3F2分布之间的差异程度。 确定每一层的|T|值的过程称为校准。方法是从验证集选取一个子集作为校准集,校准
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:510976
    • 提供者:weixin_38560502