Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-05-01
基础设施 重要性 3.86 洞察度 3.00

临时禁用 CI 中断言失败的多模态任务

该 PR 是一个典型的短期 CI 修复措施,内容简单直接。建议阅读者确认后续 tokenizer 修复后及时恢复该任务,避免长期测试覆盖缺失。设计决策亮点在于使用 `if: false` 而非完全移除 job,保留了任务定义和恢复路径。

重构 重要性 6.84 洞察度 4.00

替换硬编码 CUDA 设备为 get_device() 以支持 XPU

建议精读。虽然变更本身简单,但它展示了在大型项目中如何逐步引入设备抽象模式。重点关注 `llama.py` 中的条件分支和 `expert_distribution.py` 中通过 `get_device()` 抽象张量设备的方式,这对于未来支持更多硬件(如 NPU、AMD GPU)有参考价值。

基础设施 重要性 4.33 洞察度 2.00

回退 rebase-required CI 检测模式

该 PR 是纯粹的回退操作,变更简单直接。建议关注回退后的 CI 稳定性,以及是否有替代方案来满足原始需求(要求 PR rebase)。如果不需要该功能,可以放心合入。

基础设施 重要性 5.56 洞察度 4.00

nightly wheel 同时注册 cu129 和 cu130

建议合入。改动简洁、风险低,且提升了用户便利性。值得关注的是 `update_nightly_whl_index.py` 中错误处理的改进(从静默失败到显式抛出),这种模式值得在其他 CI 脚本中推广。

基础设施 重要性 5.03 洞察度 5.00

新增 rebase-required CI 检测模式

建议精读 `action.yml` 中的 shell 实现,了解 fail-open 设计、SHA 校验和 compare API 的使用。对于 CI 基础设施维护者有参考价值。

缺陷修复 重要性 5.62 洞察度 3.00

修复 TboAttnBackend 中 HybridLinearAttnBackend 的崩溃

该 PR 修复明确,代码简洁,值得合并。建议维护者关注 `mrope_positions` 的维度兼容性,并考虑补充直接覆盖该路径的测试。

参与讨论