Skip to content
wangzhaode edited this page Mar 25, 2026 · 5 revisions

离线量化工具

本页内容已合并至 模型压缩指南,请前往查看完整的离线量化使用说明(包含权值量化、离线量化、FP16 压缩、自动量化调优等方案)。

快速参考

离线量化使用 quantized.out(C++)或 mnnquant(Python)工具:

# C++
./quantized.out origin.mnn quantized.mnn quant.json

# Python (pip install MNN 后可用)
mnnquant origin.mnn quantized.mnn quant.json

详细的 quant.json 配置说明和使用方法,请参考 模型压缩指南 - 离线量化 章节。

Clone this wiki locally