#5254 [megatron, vllm] feat: NVFP4 (W4A16) QAT training support via ModelOpt
作者 jQizhang · 合并时间 2026-03-23 15:53
为Megatron训练管道添加NVFP4 W4A16量化感知训练支持,并通过ModelOpt集成vLLM推理。
建议技术管理者和工程师精读此PR,特别关注`verl/utils/modelopt/`模块中的设计决策,如分布式权重导出器(`QATWeightExporter`)的实现和vLLM补丁机制。此外,review讨论中提到的代码重构点值得学习,以提升代码质量和可维护性。
参与讨论