Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-13 17:27 同步状态:空闲 下次计划:2026-06-13 18:27

PR 列表

更多筛选
2026-05-19
功能 重要性 6.07 洞察度 4.00

为 Qwen3 Next 和 Qwen3.5 模型添加可配置的输出门激活类型。

值得精读,特别是对 Qwen3 系列模型进行定制推理的团队。建议关注 `Qwen3_5TextConfig` 是否需要同步添加字段,以及 `self.output_gate_type or self.activation` 的简化写法是否更优。

#24933 Amd/deepseek v4 rebase main 0509

原始 PR · 作者 kkHuang-amd · 合并时间 2026-05-19 00:15

功能 重要性 9.18 洞察度 6.00

为ROCm平台添加DeepSeek V4模型支持,新增HIP注意力后端与Triton内核

值得精读的文件包括`deepseek_v4_backend_hip_radix.py`(理解ROCm后端架构)、`compress_hip.py`(HIP专用压缩设计)和`tilelang_kernel.py`(TileLang内核实现与monkey-patch技巧)。建议重点关注环境变量治理和条件编译模式,后续可借鉴到其他平台适配。

2026-05-18
功能 重要性 5.74 洞察度 6.00

LTX2 original 模式 stage-2 改用动态 LoRA

值得精读。该 PR 展示了在共享权重场景下,通过动态 LoRA 避免请求路径上权重变动的设计思路。建议关注 review 中关于阶段无关性的建议,考虑在后续迭代中统一处理 `original` 模式的所有阶段。

功能 重要性 7.85 洞察度 5.00

SMG添加/v1/models模型名称发现回退

值得精读,特别是fallback模式的实现和测试设计。核心函数`get_model_name_from_v1_models`的JSON字段验证是良好的API适配实践。如果使用SMG,建议关注此变更,并考虑扩展类似回退逻辑。

功能 重要性 5.37 洞察度 3.00

为 DeepSeekV4 添加 fused MoE Triton autotune 支持

PR 改动简洁清晰,适合作为支持新模型架构调优的参考模板。建议关注 `swiglu_limit` 值的通用性,未来可考虑从模型配置中自动推导。

#25599 [PD] Add conclude_state to fake KV backend

原始 PR · 作者 ShangmingCai · 合并时间 2026-05-18 19:56

缺陷修复 重要性 6.24 洞察度 3.00

为 fake KV backend 添加 abort 与状态管理

该 PR 逻辑清晰、改动量小,属于常规维护级别的 bugfix/功能补强,值得合并。但其重要性较低,不需精读。

参与讨论