Prhub

sgl-project/sglang · 标签视图

标签列表

聚合结果

model-gateway 相关 PR

2026-06-03

#26106 Support Command A plus

原始 PR · 作者 zijiexia · 合并时间 2026-06-03 11:23

功能 重要性 9.18 洞察度 6.00

Cohere Command A Plus 模型推理支持

该 PR 值得精读,特别是自定义 Centered LayerNorm、sigmoid topk 路由、混合 MoE 后端分派策略以及推理/工具调用解析器的状态机设计。对于想扩展新模型支持的开发者,这是很好的参考模式。建议后续增加测试覆盖。

2026-05-23
缺陷修复 重要性 4.82 洞察度 3.00

修复 Jinja2 模板 tojson 未定义变量错误处理

该 PR 值不值得精读取决于是否负责聊天模板或错误处理模块。对于其他开发者而言,这是一个教科书级的防御性错误处理改进,值得了解但不必须深入。

2026-05-22

#26034 Fix SMG service discovery Clippy lint

原始 PR · 作者 mmangkad · 合并时间 2026-05-22 10:51

缺陷修复 重要性 5.20 洞察度 2.00

修复 SMG 服务发现 Clippy 警告

可直接合并。代码量小、改动清晰,且已通过 CI 验证。

2026-05-21
功能 重要性 7.99 洞察度 5.00

支持 IGW 模式下 PD 与常规 worker 混合服务发现

该 PR 值得阅读,尤其展示了如何在不大幅新增 CLI 参数的情况下,通过组合现有参数实现功能扩展。同时代码中针对配置误用的告警机制也是良好的实践。对于需要部署混合模型路由的场景,这是一个关键的缺失填补。

2026-05-18
功能 重要性 7.85 洞察度 5.00

SMG添加/v1/models模型名称发现回退

值得精读,特别是fallback模式的实现和测试设计。核心函数`get_model_name_from_v1_models`的JSON字段验证是良好的API适配实践。如果使用SMG,建议关注此变更,并考虑扩展类似回退逻辑。

#19524 feature: upstream cancel

原始 PR · 作者 dougyster · 合并时间 2026-05-18 16:20

功能 重要性 9.18 洞察度 7.00

客户端断连后自动取消上游 stream 请求

该 PR 值得所有 sgl-model-gateway 的维护者和使用者精读。特别是 BreakerTrackedStream 的设计(利用 Drop 在流结束时确定断路器状态)以及断路器记录时机的调整,是一个优雅地分离 HTTP 响应状态和实际流传输状态的模式。review 中关于性能优化和避免双重计数的讨论也值得学习。建议部署前做 Canary 测试,验证断路器行为符合预期。