为 kv_canary 添加 PP 自测夹具和 SWA divergence 测试
值得关注 `CanaryPPFixture` 基类的设计,它为 PP 测试提供了可复用的服务器参数配置和生命周期管理,为后续更多 PP 场景测试提供了模式参考。建议读者精读新增的扰动测试用例,了解 real-kv-hash 扰动的触发条件与断言方法。
标签列表
聚合结果
为 kv_canary 添加 PP 自测夹具和 SWA divergence 测试
值得关注 `CanaryPPFixture` 基类的设计,它为 PP 测试提供了可复用的服务器参数配置和生命周期管理,为后续更多 PP 场景测试提供了模式参考。建议读者精读新增的扰动测试用例,了解 real-kv-hash 扰动的触发条件与断言方法。
原始 PR · 作者 ShangmingCai · 合并时间 2026-06-06 00:56
修复 PD 解耦中止时 KV 缓存损坏
该 PR 值得精读,尤其是设计决策:轻量通知 vs 延迟释放。了解 PD 解耦系统中 abort 处理的权衡对相关开发者有帮助。但需注意代码中未处理的消息解析风险。
修复 incremental streaming 下 customized_info 切分与累积逻辑
值得精读。该 PR 展示了如何将动态键纳入现有流式框架,以及通过继承 Engine 进行集成测试的模式。对于需要自定义采样器并依赖流式正确性的开发者有直接参考价值。
修复 PD 解耦模式下 bootstrap_room 残留导致的误报
值得合并,修复了 PR #17430 的回归;建议阅读代码中 `_commit_transfer_to_req()` 的 sentinel 逻辑以理解上下文。
修复 CP 模式下 all_reduce/barrier 的通信组
此 PR 是必要的修复,设计清晰,推荐合入。可作为统一通信组调用的好例子。
跨TP同步sidecar命中,SWA预取全或无
值得精读 `unified_radix_cache.py` 中打包 all_reduce 的设计模式,可复用至其他 sidecar 组件。`swa_component.py` 的全或无逻辑可作为类似“原子预取”实现的参考。但需关注 review 中遗留的 `pool_storage_result` 保护问题和 sidecar 顺序假设,建议后续修复。
原始 PR · 作者 ilia-iliev · 合并时间 2026-06-05 04:15
支持 compressed-tensors WNA16 非对称权重量化
值得精读 dispatch 逻辑,了解如何与 vLLM 对齐。尽管测试被移除,但核心逻辑变更经过 review,且 kernel 路径有间接覆盖。建议未来在类似修复中保留最小单元测试。
可选调用方提供 mm_hashes 以实现确定性 pad_value
值得精读。该 PR 展示了如何在复杂系统中添加可选调用方集成接口:清晰的文档、优雅的错误处理和完备的单元测试。设计上对十六进制字符串的选择是有远见的。