Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-04-17
缺陷修复 重要性 4.87 洞察度 5.00

修复 OpenAI 函数调用测试中因随机采样导致的 flaky 断言。

建议工程师阅读此 PR 以理解如何设计更鲁棒的测试,特别是处理非确定性行为时。关注测试断言从具体硬编码到通用验证的转变,以及消除随机性的策略。review 中提到的 `strict=True` 设置问题值得后续关注。

2026-04-16

#21701 [diffusion] disaggregated diffusion

原始 PR · 作者 yhyang201 · 合并时间 2026-04-16 23:51

功能 重要性 9.36 洞察度 7.00

新增扩散模型解聚架构,将编码器、去噪器、解码器角色独立运行于不同 GPU 实例。

建议仔细阅读 `scheduler_mixin.py` 和 `orchestrator.py` 以理解核心调度和路由逻辑;关注 review 中讨论的设计决策,如数据类初始化和传输协议设计,以避免潜在缺陷;注意风险点,如实例索引一致性和性能优化,建议在部署前进行全面测试。

#22979 [HiSparse]: Adding e2e ut for hisparse

原始 PR · 作者 hzh0425 · 合并时间 2026-04-16 23:20

测试 重要性 7.35 洞察度 3.00

为 HiSparse 分层稀疏 KV 缓存系统添加端到端单元测试。

对于关注测试设计或 HiSparse 模块的工程师,此 PR 提供了单元测试的参考实现,展示了如何构建最小化组件栈进行端到端测试,值得参考以了解 HiSparse 系统测试策略。

文档 重要性 4.25 洞察度 3.00

更新Ascend NPU最佳实践文档,同步最新配置和性能数据。

建议NPU平台用户和开发者关注此文档更新,特别是配置参数和性能指标的变化。对于工程团队,可注意review中提到的标准化问题,考虑在未来统一环境变量命名和移除已弃用标志,以提升文档一致性。

基础设施 重要性 6.45 洞察度 3.00

将 OpenAI 端点 CPU-only 单元测试迁移至专用目录并注册到 CPU CI 阶段。

该 PR 对于负责测试基础设施和 CI 优化的工程师值得精读,关注点包括:测试组织策略(如何分离 CPU/GPU 测试)、mock 使用技巧(如 `test_dpsk_v32_encoding_path` 中的简化),以及 CI 注册配置的调整。设计决策展示了如何通过代码迁移和 stub 提高测试兼容性。

缺陷修复 重要性 5.80 洞察度 4.00

修复 /v1/loads 端点切换 watching 模式后 include 过滤失效的问题。

该 PR 是重要的 bugfix,值得精读以理解 watching 模式下的客户端过滤模式。关注 `get_loads` 方法中的映射字典设计和 `watching_call` 中的引用捕获时机,这些是异步通信模式下的典型设计决策。

缺陷修复 重要性 5.78 洞察度 5.00

将 /v1/loads 端点的通信器模式从 queueing 改为 watching,防止并发请求超时。

该 PR 值得后端工程师和 SRE 精读,特别是关注高并发场景下的通信模式设计。关键设计决策包括:1) 将 queueing 模式改为 watching 模式以支持结果共享;2) 在 `watching_call` 中通过局部变量捕获和引用检查来优雅处理并发清理。建议结合代码中的注释理解竞态条件防护机制。

缺陷修复 重要性 6.68 洞察度 5.00

归一化工具消息内容从数组格式到字符串,修复GLM5.1等聊天模板问题。

建议工程师精读此PR,重点关注`normalize_tool_content`函数的设计决策,如如何通过检查`type == "text"`来区分文本部分和结构化列表,以及单元测试的全面覆盖,这对于处理API兼容性问题和消息格式归一化有借鉴意义。

参与讨论