news 2026/5/26 5:53:07

PTQ 量化数值范围与优化

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
PTQ 量化数值范围与优化

一、PTQ 模型量化问题

1.1、模型问题

基于公版模型训练,没有对模型做范围做约束,weight_decay=1e-6, 训练出的 float 模型数值分布很大,如图 2,可以看到模型的后面几层数据分布范围很广,最大阈值超过了 8000,对我们量化来说并不友好。

1.2、算子问题

如图 2,基于全 int16 算子配置量化,当前版本 resize 算子有约束(请查阅工具链算子支持情况),只能支持 int8 量化,即使配置了 int16,但算子依旧退化到 int8,因此算子的 cosine 相似度也比较低,基于此阈值,max_qscale=6653/127=52.385,此 scale 过于大,并不能精细化量化模型,所以全 BPU 算子的整体精度都不高。

图 1 公版训练 float 模型

二、精度优化

2.1、cpu 高精度定位

resize 算子有限制,但对于回退 cpu 算子,就能实现 float 精度推理,配置如图 2,

图 2 配置 cpu 算子

配置了算子后,精度提升了,如图 3,可视化效果对比如图 4,整体量化精度可对齐,定位到了具体问题就是 resize 算子限制导致。

图 3 cpu 算子精度

图 4 cpu 算子可视化精度

2.2、添加 bn,加大 weight_decay

在最后的 conv 层后加上 bn 算子限制特征数据分布,同时 weight_decay 从 1e-6 调整到 1e-3,整体数据范围如图 5、图 6,模型的数据分布变小了,最后的 cosine 相似度精度也很高,非常利于 int8 量化,后期配置了 int8 量化,模型也可实现高精度量化。

图 5 全 int16 量化

图 6 部分 int16 量化

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/25 4:02:19

论文降重神器终极测评!3款论文降AIGC工具实测,AI率从90%降到10%

在论文、报告、内容创作越来越严格的时代,查AI率、检测AI率、降AI率 已经成为学生、写作者、博主的日常需求。很多同学因为 AI率过高被导师指出“AI痕迹太重”,甚至退回重写。本文今天一次性告诉你: 检测AI率应该注意什么 免费查AI率的网站有…

作者头像 李华
网站建设 2026/5/24 22:00:46

借助Dify智能体平台集成Qwen3-VL-30B打造AI Agent解决方案

借助 Dify 智能体平台集成 Qwen3-VL-30B 打造 AI Agent 解决方案 在企业智能化转型的浪潮中,一个现实问题日益凸显:如何让 AI 真正“看懂”现实世界中的图文混合信息?传统 NLP 模型面对带图的 PDF 报告、医疗影像、工业图纸时往往束手无策。而…

作者头像 李华
网站建设 2026/5/25 7:20:58

AIGC检测原理是什么?有没有免费的ai率查重工具?

论文AIGC率过高是当前很多学生和研究者在论文写作中遇到的普遍问题。别慌,只要掌握正确的方法,完全可以将AI生成痕迹有效降低,顺利通过AIGC检测。 一、AIGC检测原理是什么? 为什么自己写的论文AIGC检测会超标,一个一…

作者头像 李华
网站建设 2026/5/25 3:58:56

强力解锁:Joy-Con手柄深度自定义技术指南

强力解锁:Joy-Con手柄深度自定义技术指南 【免费下载链接】jc_toolkit Joy-Con Toolkit 项目地址: https://gitcode.com/gh_mirrors/jc/jc_toolkit 从摇杆漂移修复到红外摄像头配置的全流程解决方案 还在为Joy-Con手柄的摇杆漂移问题困扰吗?想要…

作者头像 李华
网站建设 2026/5/24 8:53:18

AIGC查重太贵?1个每天可以免费20次AIGC查重网站!

论文AIGC率过高是当前很多学生和研究者在论文写作中遇到的普遍问题。别慌,只要掌握正确的方法,完全可以将AI生成痕迹有效降低,顺利通过AIGC检测。 一、AIGC检测原理是什么? 为什么自己写的论文AIGC检测会超标,一个一…

作者头像 李华