Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 10:11 同步状态:空闲 下次计划:2026-06-07 11:11
后台正在同步并分析最近 PR,页面会自动刷新并逐步显示最新结果。

PR 列表

更多筛选 · 已设定
✕ 清空
2026-06-07

#26182 Fix Req array token-id concatenation

原始 PR · 作者 mmangkad · 合并时间 2026-06-07 10:59

缺陷修复 重要性 6.72 洞察度 4.00

修复Req中array类型token-id拼接导致的TypeError

建议合并,并后续考虑在类型检查或文档中明确`Req.origin_input_ids`应为`array`。团队可受益于阅读本PR中的设计权衡讨论,特别是类型统一策略的选择以及性能优化方案。

缺陷修复 重要性 5.54 洞察度 5.00

在 KV 写入路径添加越界探测

值得合并。这是一个低风险、高 ROI 的调试增强,在 spec 测试中已证明有效。建议在更广泛的 CI 中逐步启用 `SGLANG_ENABLE_ASYNC_ASSERT`,以最大化收益。

缺陷修复 重要性 6.51 洞察度 5.00

修复 DeepSeek V4 DP 注意力 + TP MoE 下 reduce-scatter 问题

该 PR 值得精读,以理解 DeepSeek V4 独特的手写 `_use_tp_moe_gather` 路径以及 DP 注意力与 TP MoE 交互时的数据流问题。对于关注 DeepSeek V4 模型推理或大规模并行训练的工程师有参考价值。建议合并或已合并。

参与讨论