Prhub

#21616 [Diffusion] Align diffusion benchmark skill presets with nightly comparison cases

原始 PR 作者 BBuf 合并时间 2026-03-29 12:12 文件变更 2 提交数 2 评论 4 代码增减 +186 / -117

执行摘要

对齐扩散基准预设与夜间比较案例,新增 Wan2.2-I2V-A14B 覆盖并添加预设列表功能。

根据PR body中的Motivation部分,目标包括:'Align the first 8 diffusion benchmark presets with nightly comparison models and args'、'Add Wan2.2-I2V-A14B nightly coverage'、'Move skill-only presets after nightly-aligned ones and label nightly mapping'以及'Add --list-models for quick preset-to-nightly lookup',旨在提升基准测试的标准化和易用性。

对于扩散基准测试或夜间比较感兴趣的工程师,建议快速浏览以了解预设对齐细节和新增功能;对于一般用户,可作为参考资料,无需深入分析代码逻辑。

讨论亮点

reviewer gemini-code-assist[bot] 提出两个风格改进点:一是指出extra_args列表中参数格式不一致(如--dit-layerwise-offload使用['--arg', 'value']格式,而其他使用['--arg=value']),建议统一为'--arg=value'格式以提高可读性;二是建议调整--list-models输出中的分隔符宽度以改善视觉对齐。这些建议在后续提交中被采纳,确保了代码风格一致性。

实现拆解

实现分为两个部分:

1) 文档文件benchmark-and-profile.md更新:添加预设目录表(列出预设、模型、夜间映射和说明),移除冗余下载命令(如astronaut.jpg),并更新文档说明以对齐夜间比较。
2) 脚本文件bench_diffusion_denoise.py更新:调整模型配置字典MODELS顺序,使夜间对齐预设在前、技能仅预设在后;为每个预设添加nightly_case_id字段;新增print_model_catalog()函数以支持--list-models命令输出预设列表;根据review调整参数格式和输出对齐。

文件 模块 状态 重要度
python/sglang/multimodal_gen/.claude/skills/sglang-diffusion-benchmark-profile/benchmark-and-profile.md diffusion benchmark skill modified 3.0
python/sglang/multimodal_gen/.claude/skills/sglang-diffusion-benchmark-profile/scripts/bench_diffusion_denoise.py diffusion benchmark skill modified 4.0

关键符号

print_model_catalog()

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

extra_args 参数格式标准化 style

reviewer gemini-code-assist[bot] 指出 `extra_args` 列表中参数格式不一致,建议统一为 `'--arg=value'` 格式以提高可读性

结论:建议被采纳,代码在后续提交中更新为一致格式 · 已解决

--list-models 输出分隔符宽度调整 style

reviewer 建议调整分隔符宽度以匹配内容宽度,改善 `--list-models` 命令输出的视觉对齐

结论:建议被采纳,代码在后续提交中调整了分隔符长度 · 已解决

风险与影响

技术风险较低:变更仅涉及文档和配置更新,未修改核心推理或性能逻辑。潜在风险包括配置对齐错误可能导致基准测试结果不一致(如模型参数或夜间映射错误),但通过同步更新文档和脚本可缓解;新增--list-models命令的输出对齐问题已通过review修复,不影响功能。无安全或兼容性风险。

影响范围限于使用扩散基准测试技能的开发者和用户:基准测试预设与夜间案例对齐提高了测试一致性和可比性,方便性能监控;--list-models命令简化了预设查找,提升开发效率;文档更新使指南更清晰。对系统无直接影响,属于维护性改进。

配置对齐风险 缺少测试覆盖

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论