Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-13 23:46 同步状态:空闲 下次计划:2026-06-14 00:46

PR 列表

更多筛选
2026-03-23

#21187 ci: unify PR test suite naming

原始 PR · 作者 merrymercy · 合并时间 2026-03-23 15:18

基础设施 重要性 4.00 洞察度 2.00

统一 CI 测试套件命名,提升命名一致性和可读性。

对于 CI 维护者和测试开发者,值得浏览以了解新的命名规范;对于一般开发者,无需深入,但可参考 .claude/skills/write-sglang-test/SKILL.md 更新后的测试编写指南。

缺陷修复 重要性 6.00 洞察度 4.00

修复上下文并行中当 tp_size 等于 attn_cp_size 时残余张量大小不匹配导致的推理崩溃。

对于维护 sglang 并行通信模块的工程师,建议精读此 PR 以理解 CP 中模式匹配和数据布局一致性的细节。变更虽小,但揭示了在并行计算中条件逻辑顺序的重要性,值得关注以防止类似错误;对于管理者,可快速合并以确保系统稳定。

基础设施 重要性 3.00 洞察度 4.00

移除显式Blackwell环境变量,改为通过CUDA能力自动检测。

这是一个小型基础设施变更,对核心业务逻辑影响有限。建议CI维护者关注此变更,以理解自动化检测机制和配置简化方向;对于一般工程师,精读价值不大,但可作为CI配置优化的案例参考。

基础设施 重要性 2.00 洞察度 1.00

修复 NPU CI 中 git 安全检查导致的失败问题。

此 PR 变更简单,建议快速浏览以了解 CI 配置修复方法,无需深入代码分析。对于负责 CI 维护的工程师,可参考此修复处理类似 git 安全检查问题。

重构 重要性 4.00 洞察度 2.00

将 Ngram 推测解码参数从 branch-length 重命名为 max-trie-depth,作为重构系列的一部分。

对于参与 Ngram 重构或维护推测解码功能的开发者,建议浏览此 PR 以了解参数名称变更,但变更相对机械,无需深入分析设计决策。关注点应放在确保所有文件更新一致,并检查是否有遗漏的重命名。

其他 重要性 4.00 洞察度 2.00

撤销 PR #19804 对 PPMissingLayer 的 bugfix,可能重新引入 AttributeError。

对于关注 PP 层实现或错误处理机制的工程师值得简要查看,但变更简单,重点在于理解 revert 的原因并监控潜在问题。建议结合 PR #19804 分析以了解上下文。

#20343 HiSparse for Sparse Attention

原始 PR · 作者 xiezhq-hermann · 合并时间 2026-03-23 14:09

功能 重要性 8.00 洞察度 7.00

引入 HiSparse 机制,通过 CPU 内存存储空闲 KV 缓存,提升稀疏注意力模型的批大小和吞吐量。

建议技术管理者和工程师精读此 PR,重点关注 `HiSparseCoordinator` 的设计决策和 CUDA 内核的优化技巧。值得学习的包括高效的 GPU-CPU 缓存交换机制和 JIT 内核集成模式。对于部署,需验证配置兼容性并考虑添加测试覆盖。

缺陷修复 重要性 4.00 洞察度 2.00

修复 CI 中 cutlass 导入错误,恢复 nvidia-cutlass-dsl 强制重新安装。

这是一个简单的 CI bugfix,工程师可以快速浏览以了解 pip 依赖升级时的常见陷阱(如 .pth 文件问题),但无需深入分析。建议关注点在于 CI 脚本的依赖管理实践,但无重大设计决策值得精读。

参与讨论