Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-05-18
功能 重要性 5.74 洞察度 6.00

LTX2 original 模式 stage-2 改用动态 LoRA

值得精读。该 PR 展示了在共享权重场景下,通过动态 LoRA 避免请求路径上权重变动的设计思路。建议关注 review 中关于阶段无关性的建议,考虑在后续迭代中统一处理 `original` 模式的所有阶段。

功能 重要性 7.85 洞察度 5.00

SMG添加/v1/models模型名称发现回退

值得精读,特别是fallback模式的实现和测试设计。核心函数`get_model_name_from_v1_models`的JSON字段验证是良好的API适配实践。如果使用SMG,建议关注此变更,并考虑扩展类似回退逻辑。

功能 重要性 5.37 洞察度 3.00

为 DeepSeekV4 添加 fused MoE Triton autotune 支持

PR 改动简洁清晰,适合作为支持新模型架构调优的参考模板。建议关注 `swiglu_limit` 值的通用性,未来可考虑从模型配置中自动推导。

#25599 [PD] Add conclude_state to fake KV backend

原始 PR · 作者 ShangmingCai · 合并时间 2026-05-18 19:56

缺陷修复 重要性 6.24 洞察度 3.00

为 fake KV backend 添加 abort 与状态管理

该 PR 逻辑清晰、改动量小,属于常规维护级别的 bugfix/功能补强,值得合并。但其重要性较低,不需精读。

缺陷修复 重要性 5.46 洞察度 3.00

修复 flush_cache 因 is_stats_logging_rank 报错

快速审核并合并。此 PR 修复了因之前重构引起的关键路径回归,对保证 CI 正常和服务器稳定性至关重要。

重构 重要性 5.30 洞察度 2.00

删除 scheduler.py 中无用的 is_work_request 函数

值得快速合并的清理 PR。作为重构链的一环,建议确认前序 free-item relocation PR 已合入,以确保上下文一致。无需精读。

参与讨论