#20706 [diffusion] Unify `TeaCacheParams` and `WanTeaCacheParams`

原始 PR 作者 eitanturok 合并时间 2026-03-28 09:51 文件变更 7 提交数 21 评论 13 代码增减 +202 / -112

执行摘要

统一 TeaCache 参数类，移除 Wan 特定实现，支持动态系数回调。

根据PR body，动机是“Unifies WanTeaCacheParams into the standard TeaCacheParams class to make it easier to handle teacache for different models.”，旨在消除Wan模型的特殊参数类，提供更通用的系数选择方式。这是一个独立的变更，与#19957相关。

建议工程师精读此PR，重点关注：

TeaCacheParams类的设计变化，特别是get_coefficients方法和coefficients_callback机制，展示了如何通过回调支持动态系数选择。
CFG逻辑的简化处理（get_skip_boundaries方法），这对理解扩散模型中的缓存优化和步骤管理有参考价值。
单元测试的设计，验证兼容性和回调优先级，可作为类似重构的测试范例。

讨论亮点

review中主要讨论点在wanvideo.py的CFG处理逻辑：

adarshxs询问“could you explain the logic here?”，关注新代码的实现细节。
eitanturok详细解释旧代码如何预加倍步骤造成混淆，新实现通过get_skip_boundaries方法直接处理CFG模式，简化了逻辑。
adarshxs回复“understood. got confused since the code initially did this for non cfg mode”，表示理解，讨论已解决。
最终mickqian批准PR，表明争议点已澄清。

实现拆解

实现分为三个核心部分：

参数类扩展（teacache.py）：添加coefficients_callback、start_skipping、end_skipping字段和get_coefficients方法到TeaCacheParams类，移除WanTeaCacheParams类。
模型适配（wan.py）：为Wan模型定义系数回调函数（_wan_1_3b_coefficients和_wan_14b_coefficients），并更新采样参数类使用新的TeaCacheParams。
运行时逻辑调整（wanvideo.py）：修改should_skip_forward_for_cached_states方法，使用get_skip_boundaries处理CFG逻辑，简化步骤边界计算。此外，sampling_params.py扩展了JSON序列化支持callable，test_sampling_params.py添加单元测试验证回调优先级和兼容性。

文件	模块	状态	重要度
`python/sglang/multimodal_gen/configs/sample/teacache.py`	diffusion/config	modified	8.0
`python/sglang/multimodal_gen/configs/sample/wan.py`	diffusion/config	modified	7.0
`python/sglang/multimodal_gen/runtime/models/dits/wanvideo.py`	diffusion/runtime	modified	7.0
`python/sglang/multimodal_gen/test/unit/test_sampling_params.py`	diffusion/test	modified	6.0

关键符号

get_coefficients _wan_1_3b_coefficients _wan_14b_coefficients get_skip_boundaries should_skip_forward_for_cached_states

分析完成后，这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

CFG 处理逻辑简化 正确性

adarshxs 询问新代码逻辑，eitanturok 解释旧代码如何预加倍步骤造成混淆，新实现通过 get_skip_boundaries 方法简化 CFG 处理。

结论：理解并批准，逻辑已澄清，讨论解决。 · 已解决

风险与影响

技术风险包括：

回调序列化风险：coefficients_callback作为callable，在JSON序列化时可能出错，但sampling_params.py的_json_safe函数已添加支持，通过返回模块限定名来缓解。
步骤边界回归：start_skipping和end_skipping参数的计算变更可能影响teacache跳过行为，尤其是在CFG模式下；但单元测试test_wan_teacache_boundaries_match_legacy_behavior验证了与旧行为的一致性。
系数选择逻辑变更：移除硬编码系数改为回调，可能引入运行时错误，如回调函数返回类型不匹配；但测试覆盖了回调优先级和系数获取。
总体风险较低，通过测试和代码审查缓解。

影响范围：

用户影响：Teacache参数使用更统一，Wan模型的行为应保持向后兼容，通过测试确保无功能回归。
系统影响：减少类重复（移除WanTeaCacheParams），提高代码复用性和可维护性；新回调机制为其他模型扩展teacache提供灵活框架。
团队影响：简化参数处理逻辑，便于后续开发；CFG逻辑的清晰化有助于减少未来代码混淆。
影响程度为中，主要影响diffusion模块内配置和运行时逻辑。

回调序列化风险步骤边界回归系数选择逻辑变更

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

完整报告

执行摘要

本次PR统一了TeaCache参数类，将WanTeaCacheParams集成到标准TeaCacheParams中，通过添加动态系数回调和步骤跳过边界，简化不同扩散模型的teacache处理，减少代码重复并提高可扩展性。

功能与动机

根据PR描述，动机是“统一WanTeaCacheParams到标准TeaCacheParams类，使处理不同模型的teacache更容易”。这是一个独立的变更，源于#19957，旨在消除Wan模型的特殊参数类，提供更通用的系数选择方式，以支持动态配置和简化维护。

实现拆解

主要改动点如下：

模块	关键变更	影响
参数配置 (teacache.py)	扩展`TeaCacheParams`类：添加`coefficients_callback`、`start_skipping`、`end_skipping`字段；新增`get_coefficients`方法；移除`WanTeaCacheParams`类。	统一参数接口，支持回调驱动系数选择。
模型适配 (wan.py)	定义回调函数`_wan_1_3b_coefficients`和`_wan_14b_coefficients`；更新Wan采样参数类使用`TeaCacheParams`，设置`coefficients_callback`。	Wan模型现在通过回调动态选择系数，减少硬编码。
运行时逻辑 (wanvideo.py)	修改`should_skip_forward_for_cached_states`方法：使用`get_skip_boundaries`处理CFG逻辑，简化步骤边界计算；移除对`WanTeaCacheParams`的检查。	优化CFG模式下的teacache跳过行为，提高代码清晰度。
辅助修改	- `sampling_params.py`: 扩展`_json_safe`函数支持callable序列化。
- `test_sampling_params.py`: 添加单元测试验证回调优先级和Wan边界兼容性。	确保参数可JSON化，并提供回归测试覆盖。

评论区精华

review中，主要讨论集中在wanvideo.py的CFG处理逻辑：

adarshxs：询问“could you explain the logic here?”，关注新实现细节。
eitanturok：解释旧代码如何预加倍ret_steps和cutoff_steps造成混淆，新实现通过get_skip_boundaries方法直接处理CFG模式，简化了逻辑。引用原话：“When CFG is enabled, the transformer's forward() is called twice per denoising step... The old code handled this by pre-doubling... which was confusing.”
结论：adarshxs表示理解，讨论已解决，PR获得mickqian批准。

风险与影响

风险：
- 回调序列化可能失败，但通过_json_safe函数返回模块限定名缓解。
- 步骤边界计算变更可能导致teacache跳过行为回归，但单元测试test_wan_teacache_boundaries_match_legacy_behavior验证了与旧行为的一致性。
- 系数选择逻辑从硬编码改为回调，可能引入运行时类型错误，但测试覆盖了回调优先级。
影响：
- 用户：Teacache参数使用更一致，Wan模型行为应保持兼容，不影响现有功能。
- 系统：减少代码冗余，提高维护性；新回调机制为未来模型扩展提供基础。
- 团队：简化CFG逻辑，降低未来开发复杂度。

关联脉络

此PR是SGLang中diffusion模块持续演进的一部分。关联PR包括：

21600（支持覆盖层模型）：扩展扩散模型功能，与本PR的参数统一相辅相成。
21407（修复Flux2-Klein标记化）：涉及配置调整和测试覆盖，类似本PR的测试增强。
20633（清理冗余预处理函数）：同为代码重构，提升代码质量。

这些PR共同推动扩散组件向更模块化、可维护的方向发展，本PR通过统一参数类为这一趋势添砖加瓦。

#20706 [diffusion] Unify `TeaCacheParams` and `WanTeaCacheParams`

执行摘要

统一 TeaCache 参数类，移除 Wan 特定实现，支持动态系数回调。

实现拆解

评论区精华

风险与影响

关联 Issue

未识别关联 Issue

完整报告

参与讨论