# PR #21616 完整报告

- 仓库：`sgl-project/sglang`
- 标题：[Diffusion] Align diffusion benchmark skill presets with nightly comparison cases
- 合并时间：2026-03-29 12:12
- 原文链接：http://prhub.com.cn/sgl-project/sglang/pull/21616

---

## 执行摘要
本次 PR 主要对齐了 sglang 仓库中扩散基准测试的技能预设与夜间比较案例，通过更新文档和脚本配置，新增 Wan2.2-I2V-A14B 模型覆盖和 `--list-models` 命令，提升了基准测试的标准化和易用性。变更影响范围限于扩散模块的基准测试功能，风险较低，属于常规维护性改进。

## 功能与动机
PR 的动机源自对扩散基准测试的优化需求，具体包括：
- 对齐前 8 个扩散基准预设与夜间比较模型和参数，确保测试结果一致性。
- 添加 Wan2.2-I2V-A14B 模型的夜间覆盖，扩展基准测试范围。
- 将仅技能预设移至对齐预设之后，并标记夜间映射，便于用户区分。
- 新增 `--list-models` 命令，支持快速预设到夜间案例的查找。

这些改进旨在简化开发者的基准测试流程，并增强与夜间 CI 系统的协同。

## 实现拆解
实现主要围绕两个文件展开：
1. **文档文件 `benchmark-and-profile.md`**：
 - 更新预设目录表，使用 Markdown 表格展示预设、模型、夜间映射和说明。
 - 移除冗余的输入图像下载命令（如 `astronaut.jpg`），优化文档简洁性。
 - 调整文档说明，强调夜间对齐和本地剖析的区别。
2. **脚本文件 `bench_diffusion_denoise.py`**：
 - 重构模型配置字典 `MODELS`，将夜间对齐预设（如 `flux`、`qwen` 等）置于前 8 位，技能仅预设（如 `hunyuanvideo`）置后。
 - 为每个预设添加 `nightly_case_id` 字段，存储对应的夜间案例 ID。
 - 新增 `print_model_catalog()` 函数，通过 `--list-models` 命令输出预设列表，包括预设名、夜间映射、模型路径和 GPU 需求。
 - 根据 review 建议，标准化 `extra_args` 参数格式为 `"--arg=value"`，并调整输出分隔符宽度以改善对齐。

## 评论区精华
review 过程中，gemini-code-assist[bot] 提出了两个关键风格改进点：
> **参数格式不一致**："There's an inconsistent style for defining arguments in the `extra_args` lists. Some arguments use the `['--arg=value']` format, while others use `['--arg', 'value']`." 建议统一为 `"--arg=value"` 格式，以提升代码可读性和维护性。
> 
> **输出对齐问题**："The separator width of 112 characters is inconsistent with the table's content width, which is approximately 95 characters." 建议调整分隔符长度，使 `--list-models` 输出更美观。

这些讨论聚焦于代码风格，无技术争议，建议均在后续提交中被采纳，体现了团队对代码质量的重视。

## 风险与影响
- **技术风险**：风险较低，主要涉及配置和文档更新，无核心逻辑变更。潜在风险包括配置错误导致基准测试结果偏差，但通过文档与脚本同步更新可缓解。新增 `--list-models` 命令的输出问题已修复，不影响功能。
- **影响分析**：直接影响扩散基准测试用户，提高了测试一致性和查找效率；对系统无性能或安全影响；属于维护性改进，有助于团队长期基准测试管理。

## 关联脉络
结合近期历史 PR 分析，本 PR 是扩散模块持续演进的一部分：
- PR #21600 引入了覆盖层模型支持，扩展了扩散模型的加载能力，与本 PR 的基准测试对齐相辅相成。
- PR #21407 修复了 Flux2-Klein 模型的提示词标记化问题，与本 PR 的预设配置调整共同完善扩散模块的可靠性。
- 其他如 PR #21442 处理扩散依赖兼容性，间接支持了基准测试环境的稳定性。
整体看，sglang 仓库的扩散功能正通过文档优化、bug 修复和新特性添加逐步成熟，本 PR 作为基准测试对齐的一环，增强了模块的整体协调性。