Prhub
← 返回仓库列表

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-04-18 22:27 同步状态:空闲 下次计划:2026-04-18 23:27

PR 列表

已合并 957 · 已分析 957
更多筛选
2026-04-16
缺陷修复 重要性 7.96 洞察度 5.00

修复 spec v2 流式会话奖励槽会计问题,移除兼容性门并添加全面测试矩阵。

建议精读核心源码修改(特别是 `eagle_info_v2.py` 和 `scheduler_output_processor_mixin.py`),关注奖励槽会计的时序调整设计;同时浏览测试文件以理解覆盖范围,这对维护流式会话模块至关重要。

#22912 Update .codespellrc

作者 merrymercy · 合并时间 2026-04-16 07:25

基础设施 重要性 2.53 洞察度 1.00

更新代码拼写检查配置,将 `*.lock` 文件加入跳过列表并添加 `inout` 到忽略词表。

该 PR 变更简单直接,无需精读。对于团队来说,值得关注的是配置维护的实践:定期更新工具配置以适配项目需求。对于新贡献者,可参考此 PR 了解如何调整 codespell 设置。

#22910 ci: re-enable fp8 nightly benchmark configs

作者 ishandhanani · 合并时间 2026-04-16 06:57

基础设施 重要性 4.27 洞察度 3.00

重新启用GB200 FP8夜间基准测试配置,恢复完整测试覆盖。

该PR值得快速浏览以了解CI配置的恢复情况,重点关注FP8基准测试配置的完整性和正确性。对于负责CI维护的工程师,建议验证配置中的外部引用路径是否有效。

功能 重要性 6.68 洞察度 5.00

RayEngine 在未检测到 placement group 时自动创建,简化部署流程。

该 PR 值得精读,特别是对于使用 Ray 部署 SGLang 的工程师。关注点包括:自动计算 GPU 需求的逻辑、placement group 策略选择(STRICT_PACK vs SPREAD)、以及 review 中提到的未解决问题(如 `_ACTOR_RUNTIME_ENV` 变量)是否在其他 PR 中处理。

#22905 [misc] fix ray folder lint

作者 Qiaolin-Yu · 合并时间 2026-04-16 06:08

重构 重要性 6.14 洞察度 2.00

修复 Ray 模块代码格式问题,移除多余括号和换行以符合 lint 规范。

该 PR 不值得精读,除非您关注代码风格规范或 Ray 模块的详细实现。可快速浏览以确认无意外逻辑变更。关注点在于团队如何通过小规模重构保持代码整洁。

缺陷修复 重要性 5.41 洞察度 5.00

修复流式会话中Spec V2解码超限时SWA(滑动窗口注意力)内存泄漏问题。

该PR值得精读,尤其是关注 `_trim_overshoot` 和 `_free_tail` 方法如何协同维护KV和SWA状态的一致性。设计决策体现了对称性修复的重要性,对于处理流式会话中的内存管理有借鉴意义。

文档 重要性 4.18 洞察度 3.00

澄清CI日志分析器对不兼容标志组合的issue提报规则,确保向srt-slurm仓库报告。

建议CI维护者和基础设施工程师精读此PR,重点关注 `log_analysis_prompt.md` 中的架构说明和失败分类逻辑,这对于理解srt-slurm与sglang的责任边界至关重要。同时,关注 `analyze_logs_with_modal.py` 的控制流调整,以确保自动化规则的正确实施。

功能 重要性 9.00 洞察度 6.00

为 RayEngine 添加数据并行和 DP 注意力支持,扩展多 GPU 推理能力。

建议精读 `RayDataParallelController` 类的实现,了解如何将 Ray actors 集成到现有数据并行框架中,并覆盖基类方法。同时关注提交历史中的调整点,如返回类型修复和安全绑定,这些是重要的设计决策和陷阱规避。

参与讨论