Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-05-12

#24949 Deepseek-v4-Pro share expert tp1

原始 PR · 作者 zhangxiaolei123456 · 合并时间 2026-05-12 14:19

功能 重要性 6.56 洞察度 5.00

为 DeepSeek-V4 共享专家添加 TP1 部署支持

推荐阅读,特别是关注共享专家 TP1 部署时前向传播中 all-reduce 与共享输出叠加的顺序设计。这个模式值得在类似大模型部署中参考。

缺陷修复 重要性 6.27 洞察度 6.00

修复 MultiLayerEagleWorker mamba 状态更新 bug 并清理代码

建议尽快合并,并检查其他类似位置是否存在参数位置隐患。该 PR 展示了如何通过重构和对齐代码消除隐蔽 bug,值得参考。

缺陷修复 重要性 7.72 洞察度 3.00

回滚 #22670 并修复 docs_new/index.mdx 意外修改

建议快速批准此 revert,因为它修复了文档意外变更。但团队应安排后续 PR 以不修改 index.mdx 的方式重新引入 CPU 测试,确保 CI 覆盖不长期缺失。

重构 重要性 6.23 洞察度 2.00

投机解码字段重命名收尾

该 PR 可以作为团队命名规范执行的范例,展示了如何系统性地推进代码一致性。虽然不包含功能变更,但对于参与投机解码模块的开发者,了解这些命名规则有助于理解代码结构。

测试 重要性 7.97 洞察度 4.00

迁移 Intel CPU 测试至统一注册目录

由于该 PR 已被 revert(#25044),建议在重新合并前必须修复所有已指出的问题。具体包括:修复 `test_causal_conv1d` 中的布尔张量生成错误;清理 `test_binding` 的类名;删除 `test_bmm` 中未使用的类;将 `test_decode` 的默认设备改为 `"cpu"`;修正 `test_extend` 中的拼写错误;更新 `test_mamba` 的类型提示;移除 `test_rope` 的冗余断言。同时建议强化测试代码审查及自动化 lint 检查。

#24932 [PD] Refactor hybrid state transfer

原始 PR · 作者 ispobock · 合并时间 2026-05-12 13:16

重构 重要性 8.50 洞察度 6.00

重构PD状态传输以支持多状态类型扩展

值得精读,特别是对 PD 分布式推理实现感兴趣的开发者。该 PR 通过引入枚举和列表循环,巧妙地消除了多状态转移中的大量 if-elif 判断,使添加新状态变得简单。同时,review 中的讨论澄清了去重守卫的设计动机,帮助理解混合模型状态注册的潜在陷阱。建议后续跟进 get_mamba_state_buf_infos 的泛化改造。

缺陷修复 重要性 6.89 洞察度 5.00

修复 HiCache 临时锁错误释放恢复后的 tombstone 锁

值得精读。展示了如何通过记录操作历史来解决非幂等操作在多阶段并发中的正确性问题,设计模式具有参考价值。

重构 重要性 6.24 洞察度 4.00

重命名投机解码外部API中 accepted_* 为 correct_drafts

该 PR 为纯命名清理,技术含量不高,但体现了项目对语义一致性的坚持。建议快速合并,并关注下游用户在下一个版本移除别名前的适配情况。对于希望了解项目命名规范的开发者,可以审阅 `.claude/rules/speculative-naming.md` 及本次变更作为案例。

参与讨论