Prhub

sgl-project/sglang · 标签视图

标签列表

聚合结果

consistency 相关 PR

2026-06-06
测试 重要性 7.00 洞察度 3.00

为 kv_canary 添加 PP 自测夹具和 SWA divergence 测试

值得关注 `CanaryPPFixture` 基类的设计,它为 PP 测试提供了可复用的服务器参数配置和生命周期管理,为后续更多 PP 场景测试提供了模式参考。建议读者精读新增的扰动测试用例,了解 real-kv-hash 扰动的触发条件与断言方法。

缺陷修复 重要性 7.19 洞察度 6.00

修复 PD 解耦中止时 KV 缓存损坏

该 PR 值得精读,尤其是设计决策:轻量通知 vs 延迟释放。了解 PD 解耦系统中 abort 处理的权衡对相关开发者有帮助。但需注意代码中未处理的消息解析风险。

2026-06-05

#27205 Fix customized_info incremental streaming

原始 PR · 作者 aurickq · 合并时间 2026-06-05 21:55

缺陷修复 重要性 7.54 洞察度 5.00

修复 incremental streaming 下 customized_info 切分与累积逻辑

值得精读。该 PR 展示了如何将动态键纳入现有流式框架,以及通过继承 Engine 进行集成测试的模式。对于需要自定义采样器并依赖流式正确性的开发者有直接参考价值。

#27330 [UnifiedTree]: Fix CP Reduce

原始 PR · 作者 hzh0425 · 合并时间 2026-06-05 14:03

重构 重要性 6.13 洞察度 4.00

修复 CP 模式下 all_reduce/barrier 的通信组

此 PR 是必要的修复,设计清晰,推荐合入。可作为统一通信组调用的好例子。

功能 重要性 7.64 洞察度 6.00

跨TP同步sidecar命中,SWA预取全或无

值得精读 `unified_radix_cache.py` 中打包 all_reduce 的设计模式,可复用至其他 sidecar 组件。`swa_component.py` 的全或无逻辑可作为类似“原子预取”实现的参考。但需关注 review 中遗留的 `pool_storage_result` 保护问题和 sidecar 顺序假设,建议后续修复。

缺陷修复 重要性 5.25 洞察度 4.00

支持 compressed-tensors WNA16 非对称权重量化

值得精读 dispatch 逻辑,了解如何与 vLLM 对齐。尽管测试被移除,但核心逻辑变更经过 review,且 kernel 路径有间接覆盖。建议未来在类似修复中保留最小单元测试。

2026-06-02
功能 重要性 7.23 洞察度 5.00

可选调用方提供 mm_hashes 以实现确定性 pad_value

值得精读。该 PR 展示了如何在复杂系统中添加可选调用方集成接口:清晰的文档、优雅的错误处理和完备的单元测试。设计上对十六进制字符串的选择是有远见的。