Prhub

#23924 [Diffusion] Move ModelOpt checkpoints to lmsys

原始 PR 作者 BBuf 合并时间 2026-05-02 17:18 文件变更 4 提交数 3 评论 2 代码增减 +26 / -26

执行摘要

将 ModelOpt 检查点引用从 BBuf 迁移至 lmsys

PR 描述指出需要将扩散模型 ModelOpt 检查点从个人 BBuf/ 仓库迁移到干净的 lmsys/ 组织仓库,以统一管理并减少对个人空间的依赖。参见 Hugging Face 集合: https://huggingface.co/collections/lmsys/diffusion-modelopt-69f06a1740c02269e36bf285

此 PR 属于基础设施清理,建议快速合并以完成仓库迁移,提高项目的长期可维护性。读者可以关注其组织级仓库管理策略,对于类似依赖清理有参考价值。

讨论亮点

review 过程中无实质性讨论。gemini-code-assist 机器人表示无反馈,维护者 mickqian 提供了 Approval。

实现拆解

实现分为四步:

  1. 更新测试配置文件 testcase_configs.py 中 6 个 ModelOpt 仓库常量,将 BBuf/ 前缀替换为 lmsys/
  2. 更新 docs_new/docs/sglang-diffusion/quantization.mdx 文档中的表格和说明文字,对应修改仓库路径。
  3. 更新 docs/diffusion/quantization.md 文档,同步修改仓库路径和说明。
  4. 更新 Claude 技能 SKILL.md 中的示例注释,将 BBuf/* 改为 lmsys/*
    所有修改均为纯字符串替换,保持与原始检查点一一对应。
文件 模块 状态 重要度
python/sglang/multimodal_gen/test/server/testcase_configs.py 测试配置 modified 4.45
docs_new/docs/sglang-diffusion/quantization.mdx 文档 modified 3.37
docs/diffusion/quantization.md 文档 modified 2.67
python/sglang/multimodal_gen/.claude/skills/sglang-diffusion-modelopt-quant/SKILL.md 技能 modified 1.89

关键源码片段

python/sglang/multimodal_gen/test/server/testcase_configs.py test-coverage

测试配置文件,定义了 B200 CI 使用的 ModelOpt 仓库常量,是本 PR 的核心变更之一,直接影响自动化测试。

# 将以下常量从 BBuf 迁移到 lmsys 组织,对应 Hugging Face 集合
MODELOPT_FLUX1_FP8_TRANSFORMER = "lmsys/flux1-dev-modelopt-fp8-sglang-transformer"
MODELOPT_FLUX2_FP8_TRANSFORMER = "lmsys/flux2-dev-modelopt-fp8-sglang-transformer"
MODELOPT_WAN22_FP8_TRANSFORMER = "lmsys/wan22-t2v-a14b-modelopt-fp8-sglang-transformer"
MODELOPT_FLUX1_NVFP4_TRANSFORMER = "lmsys/flux1-dev-modelopt-nvfp4-sglang-transformer"
MODELOPT_WAN22_NVFP4_TRANSFORMER = "lmsys/wan22-t2v-a14b-modelopt-nvfp4-sglang-transformer"
# FLUX.2 NVFP4 保持官方路径不变
MODELOPT_FLUX2_NVFP4_WEIGHTS = "black-forest-labs/FLUX.2-dev-NVFP4"

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险极低:变更仅涉及字符串常量,不影响控制流。主要风险在于 lmsys 仓库的可用性:如果仓库被删除或路径变化,CI 和文档将失效。但 lmsys 是组织仓库,比个人仓库更稳定。此外,官方 black-forest-labs 路径未修改,减少影响面。

直接影响:所有使用这些模型路径的 CI 测试、文档用户和 Claude 技能将指向新的组织仓库。影响范围限于 SGLang 扩散量化功能模块。无向后兼容性问题,因为旧路径不再维护。用户需更新本地引用以继续使用这些预量化模型。

低风险 路径依赖 配置变更

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论