#22631 [codex] Add LTX-2.3 benchmark skill recipes

原始 PR 作者 BBuf 合并时间 2026-04-13 12:23 文件变更 4 提交数 2 评论 7 代码增减 +130 / -7

执行摘要

为 LTX-2.3 扩散模型添加一阶段和二阶段基准测试技能配方。

LTX-2.3演化出两个原生路径（一阶段基准引入于#22111，二阶段基准路径引入于#22182），但技能文档未清晰覆盖这两个案例，导致基准设置和命令发现不一致。PR body指出：“The skill docs did not spell out both LTX-2.3 cases clearly, which made benchmark setup and command discovery inconsistent。”

建议阅读此PR以了解扩散基准测试的技能设置，但需关注GPU数量设置的决策，可能反映了性能权衡或特定硬件假设。对于基准测试一致性，建议后续评估GPU配置优化。

讨论亮点

review中由gemini-code-assist[bot]提出核心讨论：建议将LTX-2.3预设的GPU数量从2改为1，以匹配LTX-2基准并避免不必要的多GPU开销。但PR最终代码中GPU数量保持为2，未采纳此建议，讨论结论未实施，可能导致基准比较不一致。

实现拆解

实现包括四个文件的修改：

1) 在bench_diffusion_denoise.py脚本的MODELS字典中添加'ltx23-one-stage'和'ltx23-two-stage'预设，配置参数如分辨率、GPU数量等；
2) 更新benchmark-and-profile.md文档，添加这两个预设的运行示例和描述；
3) 更新两个SKILL.md文件，同步引用和命令配方。关键改动是预设拆分和文档扩充，模块属于扩散基准测试技能。

文件	模块	状态	重要度
`python/sglang/multimodal_gen/.claude/skills/sglang-diffusion-benchmark-profile/scripts/bench_diffusion_denoise.py`	扩散基准测试技能	modified	7.0
`python/sglang/multimodal_gen/.claude/skills/sglang-diffusion-benchmark-profile/benchmark-and-profile.md`	扩散基准测试技能	modified	6.0
`python/sglang/multimodal_gen/.claude/skills/sglang-diffusion-performance/SKILL.md`	扩散性能技能	modified	5.0
`python/sglang/multimodal_gen/.claude/skills/sglang-diffusion-benchmark-profile/SKILL.md`	扩散基准测试技能	modified	3.0

关键符号

MODELS（字典配置） required_gpus_for_model print_model_catalog

分析完成后，这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

GPU 数量配置一致性 性能

review 建议将 LTX-2.3 预设的 GPU 数量从 2 改为 1，以匹配 LTX-2 基准并避免多 GPU 开销，确保基准比较公平。

结论：PR 作者未采纳建议，代码中保持 2 GPU，讨论未解决。 · 未解决

风险与影响

风险较低，主要为文档和配置更改，无代码逻辑回归。但GPU设置不一致可能引入基准测试偏差，因为LTX-2使用1 GPU而LTX-2.3使用2 GPU，影响性能比较的公平性，具体在bench_diffusion_denoise.py和相关文档中。

用户影响：扩散基准测试用户现在可以方便地运行LTX-2.3的一阶段和二阶段预设，简化了命令发现和设置。系统影响：无，因为未修改核心运行时。团队影响：提高了文档清晰度，但需注意GPU配置的潜在误导。

基准不一致性 GPU 配置未优化

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

完整报告

执行摘要

此PR为LTX-2.3扩散模型添加了一阶段和二阶段基准测试技能配方，通过更新脚本和文档，提升了基准设置的明确性。然而，GPU数量设置保持为2（而非review建议的1），可能影响基准比较的一致性，建议关注此决策。

功能与动机

PR旨在解决LTX-2.3模型在基准测试中技能文档覆盖不全的问题。由于LTX-2.3演化出两个原生路径（一阶段基准和二阶段基准路径），现有文档未清晰说明，导致用户设置基准时命令发现不一致。PR body引用：“The skill docs did not spell out both LTX-2.3 cases clearly, which made benchmark setup and command discovery inconsistent。” 因此，通过添加明确的预设和文档，改善用户体验。

实现拆解

改动涉及四个文件，按模块拆解如下：

核心脚本 (bench_diffusion_denoise.py)：在MODELS字典中添加ltx23-one-stage和ltx23-two-stage预设，配置参数如分辨率、GPU数量（保持2），并更新required_gpus_for_model函数返回2 GPU。
```
"ltx23-one-stage": {
    "path": "Lightricks/LTX-2.3",
    "extra_args": ["--num-gpus=2", ...],
},
```
基准文档 (benchmark-and-profile.md)：添加两个预设的运行示例和描述，包括手动命令，但GPU数量仍为2。
技能文档 (两个SKILL.md文件)：更新引用和添加性能命令配方，确保跨技能一致性。

评论区精华

review由gemini-code-assist[bot]提出，核心讨论围绕GPU数量设置：

“The ltx23 preset is configured to use 2 GPUs, whereas the ltx2 preset uses only 1 GPU... Consider setting this to 1 GPU to match the existing LTX-2 benchmark configuration.”

讨论强调性能一致性，建议改为1 GPU以避免多GPU开销。但PR最终未采纳，代码中保持2 GPU，这可能反映了作者的不同权衡或硬件假设。

风险与影响

风险：主要风险是基准测试不一致性，因为LTX-2使用1 GPU而LTX-2.3使用2 GPU，可能导致性能比较偏差。无代码回归风险，但配置可能误导用户。
影响：用户现在可以更方便地运行LTX-2.3基准测试，提升文档清晰度；但对系统无直接影响，团队需注意GPU配置的潜在问题。

关联脉络

与历史PR #22182（“[diffusion] model: support LTX2.3 two stage”）直接相关，该PR引入了LTX-2.3的两阶段支持，本PR在此基础上扩展了基准测试文档。这表明仓库在持续完善扩散模型功能，尤其是LTX系列的性能评估工具链。

#22631 [codex] Add LTX-2.3 benchmark skill recipes

执行摘要

为 LTX-2.3 扩散模型添加一阶段和二阶段基准测试技能配方。

实现拆解

评论区精华

风险与影响

关联 Issue

未识别关联 Issue

完整报告

参与讨论