Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 11:28 同步状态：空闲下次计划：2026-06-07 12:28

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-30

#26549 [UnifiedTree]: Support eviction priority

原始 PR · 作者 hzh0425 · 合并时间 2026-05-30 15:19

功能重要性 7.22 洞察度 5.00

为 UnifiedRadixCache 和 RadixCache 引入 eviction priority 支持，节点可分配优先级影响驱逐顺序。

建议阅读此 PR，尤其关注 `get_eviction_strategy` 工厂函数和驱逐排序抽离的设计，对缓存策略扩展有参考价值。如需实现 QoS 分级，可直接使用 priority 策略。

featurerefactortest

#26764 [Hicache]: skip flaky test

原始 PR · 作者 hzh0425 · 合并时间 2026-05-30 15:16

测试重要性 2.77 洞察度 2.00

跳过 HiCache 不稳定测试避免 CI 失败

作为临时措施合理，但建议创建 Issue 跟踪 flaky 测试的根因（如时序依赖或硬件差异），并计划后续修复后移除 skipIf。精读价值低。

testhicacheci

#23122 [NPU] DFlash Speculative Decoding Support NPU

原始 PR · 作者 gjsheu · 合并时间 2026-05-30 15:13

功能重要性 7.32 洞察度 5.00

适配 DFlash 推测解码至 Ascend NPU 平台

该 PR 是 DFlash 支持 NPU 的必要适配，展示了如何通过条件分支和硬件特定算子扩展新后端。对于想了解 SGLang 硬件适配模式的读者，值得精读。同时，建议跟进后续可能增加的单元测试和更多模型的验证。

npufeaturespeculative-decoding

#26705 [Bugfix] Fix Ascend NPU CP attention for batch size > 1

原始 PR · 作者 AndyLi429 · 合并时间 2026-05-30 15:07

缺陷修复重要性 6.26 洞察度 5.00

修复 Ascend NPU CP 注意力 bs>1 崩溃

建议合并，修复明确且经过 review 验证。值得关注的设计决策是：CP 泛化后 NPU 路径的遗漏修复方式 —— 使用 `total_q_prev_tokens` 作为 Q 分割点而非全局二分。

npubugfixattention

#26709 [DOC] [NPU] add qwen3.5-397b best practice to doc_new

原始 PR · 作者 silencejade · 合并时间 2026-05-30 14:20

文档重要性 4.61 洞察度 3.00

新增 Qwen3.5-397B 在昇腾 A3 的部署最佳实践

对于 Ascend NPU 用户值得阅读并参考其中配置；对于非 NPU 用户了解即可。文档组织方式和锚点链接设计可作为后续文档编写的参考。

documentationnpuperformance

#26760 Drop dead ScheduleBatch return_routed_experts/return_indexer_topk fields

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-30 14:16

重构重要性 4.20 洞察度 3.00

删除 ScheduleBatch 死亡字段

建议快速合并。这是典型的死代码清理变更，逻辑清晰且经过 CI 验证。

refactortest

#26423 [RL] Fix crash when the reqs in a batch have a mix of `return_routed_experts` = True and False.

原始 PR · 作者 ByronHsu · 合并时间 2026-05-30 11:46

缺陷修复重要性 7.42 洞察度 6.00

修复混合 return_routed_experts 标志导致服务器崩溃

值得精读，尤其是 `_GenerationStreamAccumulator` 中对可选输出字段的 '全部填充 None' 策略。该模式可以推广到其他需要按批次位置对齐输出字段的场景，保持 batch_position 不变性。

bugfixtestrefactor

#26721 Allow PR test and lint workflows to trigger on non-main bases

原始 PR · 作者 fzyzcjy · 合并时间 2026-05-30 10:23

基础设施重要性 2.54 洞察度 2.00

解除 CI 工作流对 main 分支的触发限制

值得快速合并，属于提升开发体验的小型基础设施调整。无需精读，但可关注后续类似 CI 策略调整。

ciinfra

第 45 / 357 页 · 共 2850 条

上一页 1 … 43 44 45 46 47 … 357 下一页